株式会社ずんだもん技術室AI放送局 podcast 20260407 cover art

株式会社ずんだもん技術室AI放送局 podcast 20260407

株式会社ずんだもん技術室AI放送局 podcast 20260407

Listen for free

View show details

About this listen

youtube版(スライド付き) 関連リンク AIエージェント開発の新標準「ADLC」を読み解く — IBM×Anthropicのガイドへの共感と、本番運用からの実践的フィードバック 本記事は、IBMとAnthropicが共同で公開したAIエージェント開発のライフサイクル指針「ADLC(Agentic Development Lifecycle)」について、実務での知見を交えて解説したものです。AIエージェントをPoC(概念実証)レベルで終わらせず、本番環境で安定運用するためのフレームワークが示されています。 1. エージェント開発における3つのパラダイムシフト 従来のソフトウェア開発とエージェント開発には根本的な違いがあり、新人エンジニアがまず理解すべきは以下の3点です。 決定論的から「確率論的」へ: コードが正しくても出力が揺らぐ「LLMの性質」を受け入れ、不確実性を管理する考え方が必要です。静的から「適応的」へ: 入力や状況に応じてエージェントが動的に行動を変えるため、全パターンの網羅的なテストは困難です。コードファーストから「評価ファースト」へ: コードを書く前に、まず「何をもって成功とするか」の評価基準(Evals)を定義し、継続的に測定することが品質保証の鍵となります。 2. ADLCを形作る「2つのループ」 ADLCの最大の特徴は、開発工程の中に「2つのループ」を組み込んでいる点です。 実験ループ(開発フェーズ): プロンプト調整と評価を高速に繰り返すプロセスです。これは「バグによる手戻り」ではなく、エージェント開発における「正常な工程」として計画に組み込む必要があります。ランタイム最適化ループ(運用フェーズ): リリース後もエージェントの推論が正しいかを監視し、現場の状況に合わせて改善し続けるサイクルです。 3. 現場での実践的フィードバック コミュニケーションの武器: 「確率論的」という言葉を使うことで、顧客に対し「なぜ出力が変わるのか」を技術的に正しく説明でき、期待値調整が容易になります。「足場作り」の優先: UI等の作り込みに時間をかける前に、まずは試行錯誤ができる最低限の環境(足場)を素早く構築し、エージェントの精度向上に時間を割くべきです。ユーザーを巻き込む: 運用のスケールには、ドメイン知識を持つユーザー自身がプロンプト等を微調整できる仕組みをアプリ側に持たせることが有効です。 AIエージェント開発を「一度作って終わり」のシステムではなく、2つのループを通じて「育て続けるもの」と捉えることが、プロジェクトを成功に導くポイントとなります。 引用元: https://zenn.dev/dxclab/articles/9f015ee80cd809 Karpathy 氏が言語化した「LLM Knowledge Base」というパターン AI研究者のAndrej Karpathy氏が提唱した「LLM Knowledge Base」という概念について、その構造と可能性を解説した記事です。多くのエンジニアが試行錯誤していた「LLMによるナレッジ管理」を体系化したものとして注目を集めています。 このパターンの核心は、LLMを「ナレッジのコンパイラ(変換・整理役)」として扱う点にあります。従来のRAG(検索拡張生成)が、質問のたびに関連情報を探し出す「その場しのぎ」のアプローチであるのに対し、LLM Knowledge Baseは、あらかじめ情報を整理・構造化して「成長し続けるWiki」として永続化させるアプローチです。 具体的には、以下の3層アーキテクチャで構成されます。 Raw sources(生の素材): 論文、記事、リポジトリなどの一次情報。Schema(設計図): Wikiのカテゴリや命名規則などを定義したルール。Wiki(成果物): LLMが生成したMarkdownファイル群。人間が直接書くのではなく、LLMに保守を任せる領域です。 運用における操作も3つのステップに整理されています。 ・Ingest(取り込み): 新しい情報を読み込み、既存の知識と矛盾がないようWikiに統合する。 ・Query(質問): Wikiに対して質問し、得られた回答をさらに「新たなページ」としてWikiに書き戻す(filing back)。 ・Lint(健全性チェック): リンク切れや情報の矛盾、古くなった内容をLLMが自動で検出し、修正を提案する。 RAGとの違いは、情報の「永続性」と「蓄積」にあります。RAGはクエリごとに情報を再構成しますが、この手法ではLLMが退屈なWikiの更新作業(...
No reviews yet