KNOWLEDGE — ノウハウ記事

AI開発の進め方完全ガイド
― ツール選定から品質保証まで、企業が知るべき5ステップ

「AI開発を始めたいが、何から手をつければよいか分からない」「ツールが多すぎてどれを選ぶべきか判断できない」「PoCはできたが、本番運用に踏み切れない」。AIコーディングツールと生成AI APIの急速な普及により、企業のAI開発はかつてないほど身近になりました。しかし同時に、「どう進めるか」と「どう品質を保証するか」という二つの壁にぶつかる企業が急増しています。本稿では、AI開発の全体像、進め方の5ステップ、代表的なツール、そして避けて通れない3つの落とし穴と、その構造的な解決策まで体系的に整理します。

1. AI開発とは ― 3つの主要パターン

「AI開発」と一言で言っても、企業が取り組む内容は大きく3パターンに分かれます。自社がどのパターンに該当するかで、選ぶツールも進め方もまったく異なります。まずは現在地を把握することから始めましょう。

PATTERN 01
AIコーディング

Claude Code、GitHub Copilot、Cursor などのツールを使い、AIにコードを書かせて開発スピードを上げる方式。最も導入ハードルが低く、既存の開発チームの生産性を直接押し上げる。

PATTERN 02
生成AI活用開発

Claude API、OpenAI API、Gemini API などをアプリケーションに組み込み、自社プロダクトに対話・要約・分類・検索などの「AI機能」を持たせる方式。直近のSaaSやBtoBアプリの新機能の多くがこの形。

PATTERN 03
ML/MLOps開発

独自データで機械学習モデルを学習・推論する従来型のAI開発。データ整備・モデル管理・推論基盤と、必要な専門性が一段高くなる。

多くの企業は パターン1 → パターン2 → パターン3 の順に組織能力を積み上げていくことになります。

2. AI開発の進め方 ― 5ステップの基本フロー

AI開発は「ツールを買えば始まる」ものではありません。新規事業を立ち上げるのと同じく、段取りを踏むことで初めて成果につながります。 本章では、経営層・事業責任者の視点で「自社で進めるなら、どの順番で、何を決めるか」を整理します。

STEP 1. 何を解決したいかを決める

最初にやるべきは、「AIで、どの業務を、どう変えたいか」を一文で言える状態にすること。業務の現場に話を聞き、数字でゴールを置き、やらないことも決める。経営層の想像だけで要件を決めると、完成しても誰も使わない、というのがAI開発で最も多い失敗です。

STEP 2. 始める前に「土台」を整える

ソースコードの管理ルール/使うAIツールの選定/機密情報の取り扱い方針/品質チェックの自動化/社内ルールをAIに教える仕組み ― この5つを着手前に組織として用意する。ここを省略すると、動くものは早くできても本番運用に踏み切れなくなります。

STEP 3. AIに「やってほしいこと」を正しく伝える

背景・ゴール・対象・制約・完了条件の5要素で指示を構造化する。依頼は小さく区切る。AIへの指示は新入社員や外注先への発注書と同じ ― この感覚を組織内に浸透させることが、品質を底上げします。

STEP 4. 小さく作って、現場に触ってもらう

完璧なものを半年かけて作るのではなく、「2週間〜1ヶ月で動くものを作り、現場に触ってもらう」を繰り返す。AIが「できました」と言っても鵜呑みにせず、必ず人間が画面を触って動作を確かめる。

STEP 5. 本番に出す前と後で「責任分担」を決める

「動いた」と「会社として責任を持って出せる」の間には、大きな溝があります。4観点の人間レビュー/想定外動作への備え/全体整合性/本番反映の自動化/エラー監視/AI出力チェック/継続改善ループ/承認ルール ― これらを誰が担うかを明確化する。

STEP 1 の詳細:何を解決したいかを決める

最初にやるべきは、「AIで、どの業務を、どう変えたいか」を一文で言える状態にすることです。

  • 業務の現場に話を聞く:実際にその業務をしている担当者の困りごと・所要時間を把握する
  • 数字でゴールを置く:「問い合わせ対応の40%を自動化」「資料作成時間を月100時間削減」のように、後で成否を判定できる数字にする
  • やらないことも決める:扱う情報の範囲(個人情報・顧客データを扱うか)、対応業務の範囲、予算上限を明確に

ここを丁寧にやるかどうかが、後で触れる「PoC(試作)止まり問題」を防ぐ最大のカギです。

STEP 2 の詳細:始める前に「土台」を整える

AI開発は速いだけに、足元が整っていないと事故も速く広がります。着手前に、組織として最低限の土台を用意することが必要です。経営判断として準備しておくべきものは次の5つです。

  • ソースコードの管理ルール:作ったプログラムを安全に共有し、変更履歴を残す仕組みを決める。AIに作業させても必ず人間がレビューしてから本番に入る、という流れを作ることが目的
  • 使うAIツールの選定:AIにコードを書かせるツールを1〜2種に絞り、開発者全員が同じものを使うように統一する
  • 機密情報の取り扱い方針:顧客データ・パスワード・取引先情報といった機密情報を、AIに見せていいか/どう保管するかを社内ルールとして明文化する。AIに渡したデータが意図せず社外に出る事故は実際に発生しています
  • 品質チェックの自動化:コードが提出されるたびに、エラーや既存機能の動作確認が自動で行われる仕組みを用意する
  • 社内ルールをAIに教える仕組み:自社の開発ルール・命名規則・利用する技術を記したドキュメントを用意し、AIが作業前に毎回それを読むように設定する

STEP 3 の詳細:AIに「やってほしいこと」を正しく伝える

AIは便利ですが、指示が曖昧だと曖昧なものしか返ってきません。これは新入社員や外部委託先への指示と全く同じです。良い指示には次の5つの要素が含まれます。

  1. 背景:何のための作業か(業務の文脈)
  2. ゴール:完成したらどうなっていてほしいか
  3. 対象:何を入力すると、何が出てくるか
  4. 制約:使ってよい技術、性能要件、既存システムとの整合
  5. 完了条件:何がどう動けば「OK」とするか

悪い指示の例:「いい感じの問い合わせフォームを作って」

良い指示の例:「お客様の問い合わせを受け付けて、担当部署に自動でメール通知する画面。氏名・連絡先・問い合わせ内容を入力し、送信後に確認画面が出る」

もう一つの鉄則は 「依頼を小さく区切る」 こと。「ECサイトを作って」のような大きな依頼はAIが暴走する原因になります。「商品一覧ページだけ」「カート機能だけ」と区切れば、人間がレビューしやすく、AIの精度も上がります。

STEP 4 の詳細:小さく作って、現場に触ってもらう

完璧なものを半年かけて作るのではなく、「2週間〜1ヶ月で動くものを作り、現場に触ってもらう」を繰り返すのがAI開発のスピード感です。このフェーズで気をつけるのは次の3点。

  • 完璧を待たない:最初は荒削りでよい。現場の反応を見て、次のサイクルで磨いていく
  • AIが「できました」と言っても鵜呑みにしない:必ず人間が実際に画面や機能を触って動作を確かめる。表面的なテストが通ることと、実際に使えることはまったく別問題
  • 既存業務を壊していないか確認する:新しい機能を追加した結果、これまで動いていた機能が壊れる、というのがAI開発で頻発する事故

このサイクルを高速に回せるかが、競合との差になります。

STEP 5 の詳細:本番に出す前と後で「責任分担」を決める

ここがAI開発で最も多くの企業がつまずく箇所です。「動いた」と「会社として責任を持って出せる」の間には、大きな溝があります。

本番に出す前の確認事項:

  • 4つの観点で人間がレビュー:セキュリティ/設計の緻密さ/ブラックボックスになっていないか/品質
  • 想定外の動きへの備え:AIが書いた動作確認は「正常な使い方」しか想定していないことが多いため、エラー時や異常な入力への対応を人間が追加する
  • 全体としての整合性:個別の機能は動いても、システム全体として矛盾していないか

本番に出した後の運用:

  • 自動で本番反映する仕組み:人手作業を介さず安全に本番反映する体制を整える
  • エラー監視:問題が起きたら即座に検知できる体制
  • AIの出力チェック:AIが生成した内容がユーザーに見える製品では、不適切な出力を弾く仕組みを必ず入れる
  • 継続改善のループ:利用状況のデータを見て、AIへの指示や使うモデルをアップデートしていく
  • 誰が承認するか:AIに関連する変更を、誰が最終承認するかをルール化する

この STEP 5 を 「やる気はあるが、誰がやるか曖昧」のままにすると、組織全体でAIに対する責任が宙に浮くことになります。次章で見る「3つの落とし穴」は、ほぼすべてここに起因します。

3. 代表的なAI開発ツール一覧

STEP 2の「使うAIツールの選定」を進める際の参考として、現時点で広く使われているツールを4カテゴリで整理します。

3-1. AIコーディング系

  • Claude Code:Anthropic公式CLI。長文コンテキスト・複数ファイル横断の編集に強い。エンタープライズ用途で評価が高い
  • OpenAI Codex:OpenAIの公式エージェント型コーディングツール。CLI/クラウドでタスクを自走させる構成が特徴で、ChatGPTエコシステムとの連携が強み
  • GitHub Copilot:Microsoft/GitHub。エディタ統合と組織管理機能が充実、GitHub Enterpriseとの連携が強み
  • Cursor:VSCodeベースのAIエディタ。チャット・編集・エージェント実行を統合
  • Cline:オープンソースのVSCode拡張。複数モデル切替・自律エージェント機能

3-2. 生成AI API系

  • Claude API(Anthropic):長文処理・推論精度・安全性に定評。エンタープライズ志向
  • OpenAI API:エコシステムの広さ、Assistants API、画像生成(DALL-E)など機能網羅型
  • Gemini API(Google):マルチモーダル・Google Workspace連携、コスト効率

3-3. AIエージェント・自動化系

  • n8n:ノーコード/ローコードのワークフロー自動化。AIノードを含むハイブリッド設計が可能
  • Dify:LLMアプリ開発プラットフォーム。RAGアプリ・チャットボット構築に強い
  • LangChain / LlamaIndex:LLMアプリ構築用のフレームワーク。RAG・エージェント実装の標準的選択肢

3-4. MLOps・モニタリング系

  • Weights & Biases:実験管理・モデル管理のデファクト
  • LangSmith:LangChain開発元による LLMアプリ専用の監視・評価ツール
  • Helicone:LLM API呼び出しの観測・コスト追跡

4. AI開発でつまずく3つの落とし穴

4-1. 「動いた」と「使える」の壁(PoC止まり)

プロトタイプは作れたが、本番運用に踏み切れず塩漬けに。原因は 「品質保証の設計を後回しにした」 こと。STEP 1の段階で本番運用要件を定量化していないと、ここで詰まります。

4-2. AIが書いたコードを誰が説明するのか(ブラックボックス化)

AIは「動くコード」を出しますが、「なぜその実装を選んだか」を残しません。ハルシネーション(存在しない機能や情報をAIが作り出してしまう現象)を見逃すと、本番で初めて気づく事態になります。「誰も説明できないコード」が組織に蓄積し、保守と監査が困難になります。

4-3. 品質劣化と運用事故(暴走・ハルシネーション)

AIがプロンプトから勝手にシステム設計を変えてしまう、AIエージェントの自走が本番事故を引き起こす ― そんな事例も国内外で増えています。AIが書く動作確認は正常な使い方に偏りがちで、エラー対応や既存機能の保護が不足する傾向があります。

ROOT CAUSE

これら3つの落とし穴に共通する根本原因は、「AIが生成した成果物を、誰が、どの観点で、どう検証するか」が体系化されていないこと。ツール選定や個人スキルの問題ではなく、組織の体制の問題なのです。

5. 落とし穴を抑える解 ― AI-HITL5モデルという考え方

当社では、AI開発の落とし穴を構造的に抑えるためのフレームワーク AI-HITL5モデル(Human-in-the-Loop 5-Layer Model) を提唱しています。

5-1. 「4観点 × 5層レビュー」で品質を担保

  • 4観点:セキュリティ / 設計緻密さ / ブラックボックス回避 / 品質
  • 5層レビュー:アーキテクチャ / テスト / CI-CD / 節目コードレビュー / ガバナンス

AIが書いたコードを「動いたから良し」ではなく、観点と層を掛け合わせた格子状の検証フレームで担保するアプローチです。

5-2. AI 60% × 人間レビュー 40% の現実的なバランス

AIを使い切りつつ、人間レビューを4割確保する。これによりスピードと品質の両立を実現します。完全AI任せ(100%)も、AIを補助に留める(20%以下)も、どちらもAI開発の本質的なリスクを解消できません。

5-3. なぜ「人間レビュアー」を独立ロール化する必要があるのか

開発者本人がレビュアーを兼ねると、AIへの依存とブラックボックス化が進行します。独立した人間レビュアーを置くことで、「説明責任が回る組織」が初めて成立するのです。

READ MORE

AI-HITL5モデルの詳細は、別記事 「なぜ今AI-HITL5モデルが必要か ― AIを安全に駆動する、4観点×5層の品質担保フレームワーク」 で、4観点・5層それぞれの役割と実装例まで詳しく解説しています。

6. まとめ ― AI開発は「ツール選び」ではなく「体制づくり」

AI開発で成果を出している企業と、PoC止まりの企業の差は、ツールの選定眼ではなく 「品質保証を回す体制があるか」 にあります。

FOR YOU IF...

以下のいずれかに当てはまる経営層・事業責任者・IT部門の方は、本記事の内容が役立つはずです。
・AI開発を始めたいが、何から手をつけるか迷っている
・AIコーディングは導入したが、品質保証で詰まっている
・PoCはできたが、本番運用に踏み切れずに塩漬けになっている
・社内のAI活用で「ブラックボックス化」を懸念している

AI-HITL5モデルを実装した実行体制が、当社の 「AI-HITL5開発部」 です。月額制で、4観点 × 5層レビューを当社チーム(AIディレクター × 人間AIレビュアー × AIエンジニア)が担うサービスとして提供しています。

NEXT STEP

AI開発の「品質保証」を、月額制チームで解決する

AI-HITL5開発部は、4観点×5層レビューを当社チームが担う月額制のサービスです。「AIを使うが、品質と説明責任は組織で持ち続けたい」企業のための実行体制をご提供します。

AI-HITL5開発部の詳細を見る
月額制・スポット委託不要 AIディレクター × 人間レビュアー × AIエンジニアの3者体制 4観点 × 5層 のレビュー実装

無料相談CONTACT

毎月3社限定!無料相談

毎月3社限定で、ディレクトリジャパンの
コンサルタントが30分間の無料相談を承ります。

【こんな経営者におすすめ】

  • 漠然としたDX化の課題を整理するための相談相手が欲しい
  • 品質や開発スピードは妥協したくない!でも国内リソースは高額・・・
  • オフショア開発の実際の課題を詳しく聞きたい
  • オフショアメンバーに依頼したことが守られなくて困っている

いきなりの契約が不安な方向け3カ月お試し契約

お互いの相性を見極めるため、PoCの実施や、
短期開発対応などで、3カ月様子を見ていただき、
その後、契約更新するかどうか判断いただくことが可能です。

【こんな経営者におすすめ】

  • 初めてなのでいきなりの長期契約は不安だ
  • ディレクターやエンジニアの力量や、信頼できるかどうかを実際の働き方で判断したい
図版 図版