レポート 2026-03-18.md

本日のAIトピック（2026-03-17 06:00 → 2026-03-18 06:00 JST）

見出し: 医療と介入支援でLLMエージェント応用が拡大
要点(2–4行):
- EviAgentが画像根拠に基づく放射線レポート生成を実現
- LLM MINEが臨床ノートから認知症系表現型を抽出
- TheraAgentとInterventionLensが核医学やASD支援で多エージェント推論を導入
影響領域: 応用事例/研究/安全性
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13956
- arxiv.org/abs/2603.13673
- arxiv.org/abs/2603.13676
- arxiv.org/abs/2603.13710
見出し: LLMエージェントの失敗理解と工程評価が進展
要点(2–4行):
- 階層型プランニングの観点からWebエージェントの失敗要因を体系化した研究が公開された
- ツール使用型エージェントの各ステップ品質を診断する新ベンチマークAgentProcessBenchが提案された
- エージェントの失敗から需要駆動で企業知識ベースを構築する手法が示され実運用での改善循環を狙う
影響領域: 研究/安全性/応用事例
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.14248
- arxiv.org/abs/2603.14465
- arxiv.org/abs/2603.14057
見出し: 生成AIの制度的スケーリングと普及設計の新理論
要点(2–4行):
- 能力と信頼の乖離や非単調な適応度を含む制度的スケーリング則を提示
- 既存路線と異なる生成AIの発展軌道を提案し社会的受容の条件を議論
- 生成AIによるコンテンツ創作の外部性を考慮した競争設計でインセンティブ最適化を分析
影響領域: 研究/政策・規制
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.14126
- arxiv.org/abs/2603.14147
- arxiv.org/abs/2603.14372
見出し: 人中心メモリ管理と睡眠着想の忘却学習
要点(2–4行):
- エージェント中心から人中心へと発想を転換するメモリ管理アーキテクチャが提案された
- 睡眠に着想を得た記憶統合でLLMの順向干渉を緩和し学習の安定性を高める手法が報告された
- 長期運用時の知識劣化と更新の両立に向けた設計指針が示された
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.14212
- arxiv.org/abs/2603.14517
見出し: LLMルーティングと信頼学習を形式手法で解析
要点(2–4行):
- MaxSATの観点からモデル選択やツール選択のルーティングを推論問題として定式化
- 文脈付きバンディットでいつ信頼すべきかを学習し探索活用の判断を改善
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13612
- arxiv.org/abs/2603.13356
見出し: AIの幻覚とフィクションの逆説を概念的に検討
要点(2–4行):
- 幻覚の主観的様相と評価軸を再考
- フィクション生成における真実性と創作性の張力を分析
影響領域: 研究/安全性
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13911
- arxiv.org/abs/2603.13545
見出し: マルチモーダル安全対策と感情コスト関数の提案
要点(2–4行):
- 関係性を考慮したアンラーニングによりマルチモーダルLLMの安全性を向上させる手法が提案された
- 取り返しのつかない結果に高いコストを割り当てる感情的コスト関数の枠組みが提示されリスク回避行動を促す
- 従来の一律フィルタより文脈依存の制御を重視し実運用での誤検知と回避漏れの低減を目指す
影響領域: 研究/安全性
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.14185
- arxiv.org/abs/2603.14531
見出し: 産業特化型RAGと知識グラフによる業務支援の事例
要点(2–4行):
- エネルギー分野の熟練知識を保持するRAGアーキテクチャExpert Mindを提案
- 知識グラフと意味検索と説明可能AIを用いた求人マッチング基盤JobMatchAIを実装
- ドメイン知識の継承と説明責任を両立する実装指針を示す
影響領域: 応用事例/研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.14541
- arxiv.org/abs/2603.14558
見出し: マルチエージェント基盤と企業運用向け評価環境が公開
要点(2–4行):
- OrlaがLLMベースのマルチエージェントシステム提供と運用を支えるライブラリを提案
- EnterpriseOps Gymが状態保持型計画とツール使用を企業設定で評価する環境を提供
- エージェント運用の標準化とベンチマーク整備を加速
影響領域: オープンソース/研究/応用事例
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13605
- arxiv.org/abs/2603.13594
見出し: プロンプト複雑性と自己言及ループがLLMの構造化推論を阻害
要点(2–4行):
- 追試でプロンプトの装飾や冗長化がCar Wash問題での段階的推論を劣化
- ホフスタッターやメビウス型の自己言及ループがモデルを誤った循環へ誘導
- 提示設計と評価設計の単純化が頑健な推論に重要
影響領域: 研究/安全性
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13351
- arxiv.org/abs/2603.13378
見出し: 拒否挙動の精密制御とマルチエージェントの共謀攻撃防御を研究
要点(2–4行):
- カテゴリ別の拒否方向を発見し安全方針を微調整する手法を提示
- 協調的な敵対行動をモデル化し防御策を評価するGroupGuardを提案
影響領域: 安全性/研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13359
- arxiv.org/abs/2603.13940
見出し: LLMでオンライン自動ヒューリスティック設計とツール使用能力を拡張
要点(2–4行):
- DyACEがアルゴリズムと評価器を共進化させオンラインでヒューリスティックを設計
- AutoToolがエントロピー制約の分離でRLエージェントのツール使用スケーリングを自動化
- 複合タスク最適化と実世界エージェントの汎用性向上に示唆
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13344
- arxiv.org/abs/2603.13348
見出し: AppleがTrajTokとAMESを公開マルチモーダル研究を強化
要点(2–4行):
- TrajTokが動画理解で軌跡トークン化により効率とスケーラビリティを向上
- AMESがバックエンド非依存のマルチモーダル遅延相互作用検索を提案
- 企業内検索と動画理解の実運用に向けた基盤技術を提示
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- machinelearning.apple.com/research/trajtok
- machinelearning.apple.com/research/ames
見出し: NVIDIAがOpenClaw強化のNemoClawを発表セキュリティ重視
要点(2–4行):
- NVIDIAがGTCでOpenClawのセキュリティ層NemoClawを発表
- サンドボックスやポリシー制御で機密作業を安全に実行する狙い
- コミュニティ検証が始まり企業採用の障壁緩和に期待
影響領域: オープンソース/安全性/企業動向
一次ソースURL（代表のみ箇条書き）
- techcrunch.com/2026/03/16/nvidias-version-of-openclaw-could-…
- zenn.dev/komlock_lab/articles/280ff7f1ba9b13
見出し: 降水ナウキャスティングでトークナイズとMixture of Expertsの新手法
要点(2–4行):
- MeTokが気象データに適した効率的トークン化と整合学習を提案
- PA Netが降雨のロングテール分布に適応する専門家混合で精度を改善
影響領域: 研究/応用事例
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13752
- arxiv.org/abs/2603.13818
見出し: 確率論理に対する状態代数を定式化
要点(2–4行):
- 状態表現に基づく新たな確率論理フレームを提示
- 推論の一貫性と計算特性を理論解析
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13574
見出し: 医療推論で閉源LLMの忠実性を検証
要点(2–4行):
- もっともらしさと事実忠実性を分離評価する枠組みを提示
- 臨床判断支援でのリスク把握と評価設計に示唆
影響領域: 安全性/研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13988
見出し: 数学推論でGRPOと自己反省報酬を検証
要点(2–4行):
- 逐次推論の強化学習手法GRPOを用い解法探索を安定化
- 反省に基づく報酬設計で正確性と一貫性を向上
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.14041
見出し: xAIのGrok生成物を巡り10代が提訴
要点(2–4行):
- 10代の原告がxAIに対しGrokのAI生成CSAMで提訴
- モデレーションとガードレールの適切性が争点に
- 生成AIの法的責任と規制の議論が加速
影響領域: 政策・規制/安全性
一次ソースURL（代表のみ箇条書き）
- www.theverge.com/ai-artificial-intelligence/895639/xai-grok-…
見出し: LLMの事後学習でSFTとRLを体系比較
要点(2–4行):
- 教師あり微調整と強化学習の効果とトレードオフを分析
- 実務上の選択指針と評価ベンチマークを整理
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2603.13985

日次レポート

本日のAIトピック（2026-03-17 06:00 → 2026-03-18 06:00 JST）