レポート 2026-05-12.md

本日のAIトピック（2026-05-11 06:00 → 2026-05-12 06:00 JST）

見出し: エージェント記憶と継続学習の理解と手法が前進
要点(2–4行):
- デプロイ中のLLMを事例ベースで順応させるCASCADEが提案。
- エージェント記憶機構の進化を俯瞰するサーベイが公開。
- 事前発話のコミット理論や検索のPOMDP定式化により推論挙動を理論面から分析し、思考の長文化が位置バイアスを増幅する傾向を指摘。
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.06702
- arxiv.org/abs/2605.06716
- arxiv.org/abs/2605.06723
- arxiv.org/abs/2605.07042
- arxiv.org/abs/2605.06672
見出し: LLMエージェントの実行計画と世界モデル化の新手法
要点(2–4行):
- 自己プログラム化によるエージェント実行や再帰推論の状態表現と終了条件を検討。
- アフォーダンスに基づく世界モデルで前提条件の組合せを扱う枠組みを提案。
- 階層計画の方策分解再利用や2.5D分解による空間構成を提示。
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.06898
- arxiv.org/abs/2605.06690
- arxiv.org/abs/2605.06841
- arxiv.org/abs/2605.06957
- arxiv.org/abs/2605.07066
見出し: エージェントの解釈性と監査に関する新手法が相次ぎ提案
要点(2–4行):
- 推論トレースから探索木を抽出し近視眼的計画を診断する手法が報告。
- ツール使用の解釈可能化や統一グラフ表現による監査可能LLMエージェント設計が提示。
- 監督可能な行動手がかり推論や随時有効な統計での適応型監査など安全性強化の枠組みが示される。
影響領域: 研究/安全性
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.06840
- arxiv.org/abs/2605.06890
- arxiv.org/abs/2605.06812
- arxiv.org/abs/2605.07021
- arxiv.org/abs/2605.07002
見出し: 汎用エージェント評価と訓練環境の整備が進展
要点(2–4行):
- 視覚Webエージェント向けにスケーラブルで再現可能な訓練環境Weblicaを提案。
- 一般的な逐次意思決定エージェントの統一ベンチマークAgentickを公開。
- 最短級の長鎖推論課題でLLMの限界を実証する研究が報告。
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.06761
- arxiv.org/abs/2605.06869
- arxiv.org/abs/2605.06882
見出し: マルチエージェント協調での隠れた連携とランダム性の必要性を示唆
要点(2–4行):
- 内部表現のスペクトル解析で隠れた連携を検知する診断法を提案。
- 協調には場合によりランダム性が不可欠であることを理論的に示す結果が報告。
- グラフ課題で分割統治型マルチエージェント推論のスケーラビリティを実証。
影響領域: 研究/安全性
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.06696
- arxiv.org/abs/2605.06825
- arxiv.org/abs/2605.06671
見出し: 制約学習と因果実験設計の新アプローチ
要点(2–4行):
- 逆強化学習で多目的制約を推定する手法を提示。
- 部分識別下での因果効果推定に最適な実験計画を理論化。
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.06951
- arxiv.org/abs/2605.06993
見出し: RLHFの認知バイアス緩和と生成AIの認知進化の偏りを分析
要点(2–4行):
- 合理性の変更でRLHFに内在する認知バイアスを抑制する手法を提案。
- 世代間で生成AIの認知能力が不均一に進化することを測定。
影響領域: 研究/安全性
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.06895
- arxiv.org/abs/2605.06815
見出し: 確率的コモンセンスによる仮説推論
要点(2–4行):
- 確率的常識知識を用いたアブダクション手法を提案
- 不確実性下での因果的説明生成を強化する狙いを述べる
- 評価設定と結果要旨をarXivで共有
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.08011
見出し: 学習観測者に対する反復的欺瞞経路計画
要点(2–4行):
- 観測側が学習する環境での欺瞞的経路計画問題を定式化
- 反復ゲーム下の最適策略と検出回避を解析
- 防衛と攻撃の双方に関わるロボティクス安全性課題に言及
影響領域: 研究/安全性
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07174
見出し: 実用性を重視したパレート最適な合成計画
要点(2–4行):
- 複数目的を考慮した化学合成経路の最適化を提案
- 実行可能性とコストなどの指標を同時最適化
- 合成設計の実務適用に前進
影響領域: 研究/応用事例
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07521
見出し: 共有供給が未知なオンライン配分の理論解析
要点(2–4行):
- 共有資源の総量が未知な状況でのオンライン配分問題を定式化
- 競合比などのアルゴリズム性能保証を提示
- 広告配信やクラウド資源割当への応用を想定
影響領域: 研究/応用事例
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07080
見出し: LLM評価を用いた常微分方程式の自動発見
要点(2–4行):
- 質的評価と量的評価を組み合わせて候補ODEを選別
- データ駆動で物理法則の同定を支援
- 科学発見の自動化に向けた一歩
影響領域: 研究/応用事例
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07323
見出し: ベイズ最適化でオープンエンドなタスク発見
要点(2–4行):
- タスク空間探索を自動化し多様な課題を生成
- 目標達成度に基づくサンプル効率の高い発見
- 自律学習の継続的カリキュラムに有用
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07572
見出し: 暗黙知抽出を論理拡張生成と能動推論で実現
要点(2–4行):
- 暗黙知抽出の枠組みを提案し論理拡張生成と能動推論を統合
- 言語モデルに推論一貫性と知識獲得を促す設計を報告
- arXivにて手法概要と評価設定を公開
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07639
見出し: 経路署名とDTWによるオンライン目標認識
要点(2–4行):
- パスシグネチャと動的時間伸縮を用いた目標推定手法を紹介
- オンライン推論に適した計算手順を記述
- 評価設定の概要を示す
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07736
見出し: テキストから動画を生成するAPI実装ガイド
要点(2–4行):
- テキスト入力から動画を生成するAPIの設計手順を解説。
- 実装のポイントやモデル活用の基本を紹介。
- 開発者向けの実装ガイドとして公開。
影響領域: 応用事例
一次ソースURL（代表のみ箇条書き）
- qiita.com/MusicMakerAI/items/6a7dd0bd8762ab64ab8a
見出し: 暗黙圧縮正則化でRL後学習の簡潔推論を実現
要点(2–4行):
- 内部分布を短縮する正則化で冗長推論を抑制
- 精度維持と出力短縮の両立を報告
- 推論コスト削減と信頼性向上に寄与
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07316
見出し: 正則制約付き可変次数マルコフ生成の厳密解法
要点(2–4行):
- スパース文脈状態信念伝播に基づく厳密生成手法を提案
- 正則制約を満たす可変次数モデルの効率的生成を実現と説明
- 理論特性と実験設定の概要を報告
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07839
見出し: アレアトリ不確実性下でのAI選別配分の限界
要点(2–4行):
- 確率的不確実性下における最適選別と資源配分の理論枠組みを提示
- AI主導の配分に内在する限界やトレードオフを分析
- 政策や運用への含意に言及
影響領域: 研究/政策・規制
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07979
見出し: 連続的ツールフローで進化するエージェント推論
要点(2–4行):
- ツール呼び出しを連続フローとして最適化
- 段階的学習で推論の適応性と効率を向上
- 複雑タスクの長期計画に有効
影響領域: 研究
一次ソースURL（代表のみ箇条書き）
- arxiv.org/abs/2605.07339

日次レポート

本日のAIトピック（2026-05-11 06:00 → 2026-05-12 06:00 JST）