『Dify×チャットフロー』ノーコードで自分専用の議事録AIを構築!プロンプト制御による高品質な会議まとめ術

Difyを用いた議事録自動生成ツールの構築ガイドです。ノーコードでの文字起こし・要約の効率化術を解説します。実践的なプロンプト設定からワークフロー設計まで網羅し、組織のDX推進をサポートする実践的な内容です。

はじめに|Difyで議事録作成を自動化:ノーコードで構築するAIアシスタントの可能性

会議後の議事録作成に費やす時間は、膨大になりがちです。音声の文字起こしから、要点の抽出、アクションアイテムの整理まで、気づけば1時間以上が経過していることも珍しくありません。

そのような煩雑な作業を自動化できるのが、AI開発プラットフォーム「Dify」です。

この記事では、Difyを活用して議事録作成ツールを実際に構築し、それによってどれだけ業務効率が向上するかを検証しました。ノーコードで開発できるため、技術的な知識がない方でもすぐに実践・活用できる内容となっています。

【初心者向け】Difyとは?ノーコードでLLMアプリを構築できるプラットフォーム

Difyは、ドラッグ&ドロップの直感的な操作で、LLM(大規模言語モデル)を活用したAIアプリケーションを構築できるオープンソースプラットフォームです。

特徴

説明

ノーコード開発

プログラミング不要でAIアプリを構築可能

複数LLM対応

OpenAI、Claude、Geminiなど主要モデルを切り替えて利用可能

ワークフロー機能

複数の処理を組み合わせた自動化フローを設計可能

オープンソース

無料で利用開始でき、カスタマイズも自由

特に、2025年7月14日にリリースされたv1.6.0では、業界標準プロトコル「MCP(Model Context Protocol)」に対応したことで、外部サービスとの連携機能が大幅に強化されました。

出典:Dify v1.6.0:双方向MCP機能を内蔵

Difyのダッシュボード画面。直感的なUIでAIアプリを構築できます

議事録作成の課題:なぜ会議後の業務は時間がかかるのか?

多くの企業で会議後の議事録作成が課題となっている背景には、以下のような要因があります。

  1. 作業工数と時間の増大
    会議内容の正確な把握から、音声の聞き返し、文字起こし、要点抽出、整形に至る一連の工程に多大な時間を要しています。特に長時間や専門性の高い会議では担当者の負担が顕著であり、本来業務を圧迫する要因となっています。この慢性的な工数増大が、組織全体の生産性低下を招いています。
  2. 品質の均一性の欠如と標準化の困難さ
    議事録作成が属人化しており、担当者のスキルや主観によって記載内容の粒度やフォーマットに差が生じています。この品質の不均一さは、必要な情報への迅速なアクセスを妨げ、過去の議事録をナレッジとして再活用する際の大きな障壁となっています。組織としての品質標準化と維持が急務となっています。
  3. 情報共有の遅延によるビジネス機会の逸失リスク
    作成に時間を要することで、決定事項や重要情報のリアルタイムな共有が困難になっています。迅速な意思決定が求められるビジネス環境において、この情報の停滞はネクストアクションへの移行を遅らせ、ビジネス機会の逸失や判断精度の低下を招くリスクを増大させています。

これらの課題を解決するために、AIを活用した自動化アプローチが注目されています。

第1章|導入準備:Difyのアカウント作成と最適なLLMモデルの選び方

この章では、Difyを使い始めるための基本設定を行います。

Difyアカウント作成・初期設定

まずはDifyのアカウントを作成します。以下の手順に沿って進めてください。

アカウント作成手順

  1. Dify公式サイト(https://dify.ai)にアクセスする
  2. 「Get Started」をクリックする
  3. メールアドレスとパスワードを入力してアカウントを作成する
  4. 認証メールから本登録を完了する

GPT-4oやClaudeも利用可能:用途に合わせたLLMモデルの選択基準

Difyでは、多様なLLMを柔軟に切り替えて利用できます。デフォルトではOpenAIが設定されており、GeminiやClaudeといった主要なモデルもAPIキーを設定することで利用可能です。

プラン別メッセージ数(OpenAIモデル使用時)

プラン名

月間メッセージ送信数

特徴・制限事項

無料プラン

200メッセージ

制限を超過した場合、翌月まで送信機能が利用不可

プロプラン

5,000メッセージ

本格的なビジネス運用に適した余裕のある送信枠

Difyのプラン構成と主な違い

Difyには「無料プラン」と「プロプラン」の2種類が存在し、最大の違いは1ヶ月間に送信できるメッセージの数にあります。

  1. 無料プラン

サービスを手軽に試したい個人や、小規模なテスト運用を目的としたユーザー向けです。基本的な機能を無料で利用できますが、メッセージ数には厳格な制限があります。

無料プランを推奨する対象

  • Difyで何ができるのかをまず触ってみたい初心者の方。
  • 非常に低い頻度でしかメッセージを送信しない個人ユーザーの方。
  1. プロプラン

ビジネス用途や本格的な運用を検討しているユーザー向けです。無料プランと比較して大幅に多い送信枠が提供されており、チームや複数のプロジェクトでの安定した運用に適しています。

プロプランを推奨する対象

  • 中小規模のビジネスで、定期的に顧客コミュニケーションや社内業務に活用したい方。
  • 複数のプロジェクトを同時並行で進めたり、チームで安定したメッセージ配信環境を確保したい中級者以上のユーザー。

なお、本記事はOpenAIの無料プランを用いてご説明します。

※上記のメッセージ数はOpenAIモデルを使用した場合に適用されます。その他のモデルを利用する場合は、APIを通じた従量課金が必要となります。また、メッセージ数は毎月1日にリセットされます。

出典:Dify: Plans & Pricing

LLMモデルの設定画面。APIキーを入力することで様々なモデルを利用できます

音声ファイルの準備

議事録作成では音声の文字起こしが必要になるため、音声データを事前に準備しておきます。

![音声ファイルのサンプル](audio_sample.png)

テスト用の音声ファイル

注意事項

  • 相性が悪い拡張子があるため、mp3やwav形式での準備を推奨します。
  • 音声品質が高いほど文字起こしの精度が向上します。

第2章|実践ガイド:Difyで「音声から議事録」を自動生成するワークフロー構築手順

この章では、実際にツールを構築していきます。今回はチャットフロー型のアプリケーションとして設計し、音声ファイルをアップロードすると自動で議事録が生成される仕組みを作ります。

STEP1 Difyでのプロジェクト作成方法の選択

Difyでは、プロジェクトの目的やカスタマイズの自由度に応じて、以下の3つのアプローチから作成方法を選択できます。

  1. 最初から作成(スクラッチ開発)

アプリケーションの構成をゼロから自由に構築する方法です。特定のビジネス要件に合わせて、ワークフローのロジックやプロンプトの細部を厳密に作り込みたい場合に最適です。独自の外部ツールと連携させたり、複雑な条件分岐を設定したりするなど、高度なカスタマイズが必要なプロジェクトに向いています。

  1. テンプレートから作成

Difyがあらかじめ用意している「SEOブログ作成」「YouTubeチャンネルデータ分析」「文章添削」といった、実用的なテンプレートをベースに開発を始める方法です。すでに確立されたユースケースを活用できるため、開発時間を短縮したい場合や、まずは動くものを作って試してみたい場合に適しています。

  1. DSLファイルからインポート

Difyのワークフロー設定を記述した専用ファイル(DSLファイル)を読み込んでアプリを再現する方法です。主に、自分で作成したアプリケーションを他のアカウントや環境へ移行したい場合や、チーム内で全く同じ設定のアプリを共有・バックアップしたい場合に利用されます。

今回は「最初から作成」を選択します。

STEP2 アプリタイプとアプリ名の設定

以下の内容でアプリケーションの基本設定を行います。

設定項目

入力内容

アプリタイプ

ワークフロー

アプリ名

議事録作成ツール

説明文

音声ファイルから自動で議事録を生成するツール

アプリタイプとアプリ名の設定画面

STEP3 ワークフローエディタの初期画面を確認

アプリケーション作成後、自動的にワークフローエディタ画面に移動します。

ワークフローエディタの初期画面。ここからノードを追加していきます

STEP4 音声入力ノードの設定

まず、ユーザーからの音声ファイル入力を受け取るため、開始ノードを設定します。

設定手順

  1. 開始ノードをクリックする
  2. 入力フィールドの横の「+」をクリックする
  3. 入力フィールドを追加する

入力フィールドの設定内容

設定項目

設定値

フィールドタイプ

単一ファイル

変数名

input_file

サポートされたファイルタイプ

音声、映像

アップロードされたファイルタイプ

両方

入力フィールドを追加する画面

STEP5 Speech To Textノードの設定とモデル選び

音声データをテキストに変換するノードを追加します。

設定手順

  1. 音声入力ノードの「+」をクリックする
  2. 「ツール」を選択する
  3. 「Speech To Text」を追加する
  4. 入力変数とモデルを設定する

Speech To Textの設定内容

設定項目

設定値

入力変数

input_file

モデル

gpt-4o-mini-transcribe

入力変数、モデルの設定画面

STEP6 文字起こしデータを議事録形式に構造化する

文字起こしされたテキストを議事録形式に構造化するノードを追加します。

設定手順

  1. 文字起こしノードの「+」をクリックする
  2. 「LLMブロック」を追加する
  3. モデルを選択する(今回はgpt-4o-miniを選択)
  4. コンテキストに「text」を選択する
  5. システムプロンプトを入力する

システムプロンプト

以下のプロンプトを入力してください。

あなたはプロの議事録作成者です。

{{text}}から、企業で使用される正式な議事録を作成してください。

# 作成ガイドライン

– 敬語を使用した丁寧な文書

– 発言の要旨を正確に把握

– 決定事項とタスクを明確に区別

– 不明な情報は推測せず「不明」と記載

# 議事録フォーマット

### 会議概要

– 会議名: \[推定される会議の目的\]

– 開催日時: \[推定または不明\]

– 参加者: \[発言者から推定\]

– 司会: \[判明する場合のみ\]

### 協議事項

\[議題ごとに整理して記載\]

### 決議事項

\[承認・決定された内容\]

### 検討継続事項

\[結論が出なかった事項\]

### アクションプラン

| 項目 | 担当者 | 期限 | 備考 |

|——|——–|——|——|

| \[タスク\] | \[担当者\] | \[期限\] | \[補足\] |

### 次回開催予定

\[次回会議の予定があれば記載\]

構造化ノードのプロンプト設定画面

STEP7 終了ノードの設定

ワークフローの出力を定義する終了ノードを設定します。

設定手順

  1. 構造化ノードの「+」をクリックする
  2. 「終了ブロック」を選択する
  3. 設定の「+」をクリックする
  4. 変数に「text」を入力する

終了ノードの変数設定画面

STEP8 出力テスト

ワークフローが正しく動作するかテストを行います。

テスト手順

  1. 「実行」ボタンをクリックする
  2. 「ローカルアップロード」を選択し音声データをアップロードする
  3. 「実行開始」をクリックする
  4. エラーが出ないかをチェックする

エラーが出ないことが確認できたら、ワークフローの構築は完了です。

第3章|運用・検証:構築した議事録AIの精度と処理速度をチェックする

ツールが完成したら、最終確認を行います。以下のMVP(Minimum Viable Product)検証項目をチェックしてください。

MVP検証項目チェックリスト

  • 動作の安定性(動作確認)

まずは、30分以内の会議音声データを使用して、途中でエラーが発生することなく最後まで正常に処理が完了するかを確認します。

  • 出力精度の検証(出力形式)

生成された結果が、あらかじめ設定した「基本的な議事録フォーマット」に従っているかをチェックします。必要な項目(議題、決定事項、タスクなど)が正しく網羅されているかがポイントです。

  • 処理効率の評価(処理速度)

実用性を担保するため、処理にかかる時間が「元の音声時間の5分の1以下」に収まっているかを測定します。例えば、10分の音声であれば2分以内に書き出しが終わることを基準とします。

議事録AIの出力結果サンプル

おわりに

Difyのチャットフローを用いた「議事録AI」の構築方法をご紹介しました。

音声入力による文字起こしから、構造化プロンプトを活用した精度の高い要約まで、一連のステップを習得できたのではないでしょうか。このシステムは、単なる記録ツールとしてだけでなく、以下のような様々なシーンに応用可能です。

  1. ネクストアクションの自動抽出によるタスク管理の効率化

会議の中で決まった「誰が・いつまでに・何をやるか」という指示をAIが自動で抜き出します。これにより、会議後のタスク整理の手間が省け、チーム内での実行漏れを防止できます。

  1. インタビュー内容のナレッジ化による知見の蓄積

顧客へのヒアリングや社内のエキスパートへのインタビューをデータ化します。バラバラになりがちな「現場の声」や「個人のノウハウ」を構造化して保存することで、社内データベースとしていつでも検索・活用できるようになります。

  1. 研修・セミナーの記録と情報の整理・共有

長時間にわたる研修やセミナーの要点を整理します。参加できなかったメンバーへの共有はもちろん、重要なポイントを短時間で振り返るための教育用コンテンツとしても役立ちます。

日々の業務の非効率を解消し、よりクリエイティブな仕事に集中するためのパートナーとして、ぜひ本システムをご活用ください。

出典・参考情報

本記事の作成にあたり、以下の情報を参考にしました。

公式ドキュメント・リポジトリ

  • Dify公式サイト https://dify.ai
  • Dify公式ドキュメント https://docs.dify.ai/ja-jp
  • Dify GitHubリポジトリ https://github.com/langgenius/dify
  • v1.6.0リリース情報(MCP対応) https://dify.ai/blog/v1-6-0-built-in-two-way-mcp-support

用語解説

用語

説明

Dify

オープンソースのLLMOpsプラットフォーム。ノーコードでAIアプリケーションを構築可能

LLM

Large Language Model(大規模言語モデル)の略。ChatGPTやClaudeなどのAIモデルの総称

チャットフロー

対話形式でユーザーと情報をやり取りするワークフローの形式

MCP

Model Context Protocolの略。AIエージェントが外部サービスと連携するための業界標準プロトコル

Speech To Text

音声データをテキストに変換する技術

CONTACT

株式会社TWOSTONE&Sonsグループでは
60,000人を超える
人材にご登録いただいており、
ITコンサルタント、エンジニア、マーケターを中心に幅広いご支援が可能です。
豊富な人材データベースと創業から培ってきた豊富な実績で貴社のIT/DX関連の課題を解決いたします。

  • コンサルティング対応
    コンサルティング
  • 内製化支援・人材紹介・派遣対応
    内製化支援・人材紹介・派遣
  • 受託開発対応
    受託開発

幅広い支援が可能ですので、
ぜひお気軽にご相談ください!