DifyとLINEを連携してAIチャットボットを構築する方法を解説
自動化
海外企業のWebサイトから情報を収集し、スプレッドシートへ転記する際、手作業はもう必要ありません。Difyを使い、URLリストから企業情報を自動で抽出しスプレッドシートにまとめる方法を解説します。リサーチを自動化し、分析や戦略立案に集中しましょう。
海外の競合他社や新しいトレンドを調査する際、複数のWebサイトを見比べて情報を集め、手作業でスプレッドシートにまとめるのは非常に時間がかかります。特に、海外サイトの情報となると、言語の壁も加わり、さらに手間がかかることも少なくありません。
この記事では、AIアプリ開発プラットフォーム「Dify」のワークフロー機能を活用し、「GoogleスプレッドシートにリストアップしたURLから、海外スタートアップの企業情報を自動で収集・要約し、結果を同じシートに書き出す」仕組みの構築手順を、ステップ・バイ・ステップで詳しく解説します。
この仕組みを導入することで、面倒な情報収集作業をAIに任せ、分析や戦略立案といった重要な業務に集中できるようになります。

ワークフローの作成を始める前に、Difyと外部サービスを連携させるための準備をします。
まずは、作業に必要なアカウントやデータを用意しましょう。
・Difyのアカウント:無料で作成して利用開始できます。
・Googleアカウント:Google SheetsとGoogle Cloudを利用するために必要です。
・調査対象の企業URLリスト:事前に情報を収集したい企業のURLをいくつかリストアップしておきましょう。
DifyからGoogle Sheetsの情報を読み取るため、Google Cloudでサービスアカウントを作成し、キー(JSON)をダウンロードしましょう。

Webページから本文だけを綺麗に抽出してくれる「Jina AI」サービスのAPIキーを取得します。

次に、情報収集の起点となり、結果を書き出すスプレッドシートを準備します。

これで全ての事前準備が整いました!いよいよDifyでワークフローを作成していきましょう。
Difyにログインし、ワークフローを作成します。

ここからは、Difyのキャンバスにブロックを追加し、それぞれを繋ぎ合わせて自動化の仕組みを組み立てていきます。一つ一つの操作を詳しく見ていきましょう。
ワークフローの一番左に、すでに「開始」ブロックが配置されています。これはワークフローを起動する起点となるブロックです。今回は手動で実行するため、このブロックの設定は特に変更する必要はありません。
このブロックは、連携したGoogleスプレッドシートにアクセスし、指定された範囲のデータ(今回はURLリスト)を一括で読み込む機能を担うブロックです。
まず、「開始」ブロックの右側にある「+」ボタンをクリックしてください。ツールの選択画面が表示されます。
スプレッドシートから読み取ったデータは、そのままだと余計な情報が含まれていたり形式が複雑だったりします。このブロックでは、読み込んだデータから必要な「URL」だけをきれいに抜き出し、次の工程で処理しやすいリスト形式に変換します。
def main(**kwargs): sheet_data = kwargs.get(‘sheet_data’, []) url_list = [item[‘A’] for item in sheet_data if item and ‘A’ in item] return {“result”: url_list} |
|---|

ここまでの手順で作成された「URLのリスト」を受け取り、その一つひとつに対して順番に「Webサイトの調査」と「結果の書き込み」を行うためのループ(繰り返し)機能を担うブロックです。

ここからは、取得したURLリストの一つひとつに対して、繰り返し処理を行う「イテレーション」ブロックの内部を設定していきます。
各企業のWebページから情報を抽出し、要約、そしてスプレッドシートの正しい行に書き込むまでの一連の自動化フローを組み立てていきましょう。
このブロックでは、イテレーション(ループ)で渡されたURLにアクセスし、Webページの情報を取得するブロックです。広告やメニューなどの余計な情報を省き、AIが読み取りやすいテキスト形式(Markdownなど)に変換して取得します。

このブロックは、Jina AIが取得した大量のWebサイトのテキストから、必要な情報(社名、設立年など)だけをピンポイントで抜き出し、指定したフォーマットに整理する役割を担います。

こちらは、抽出したデータをスプレッドシートに書き込むために、「どの行に書き込むか」を計算し、APIが受け取れる形式(JSON)に整形するブロックです。ループの回数(index)を使って、2行目、3行目…と書き込み位置をずらしていきます。
import json def main(**kwargs): loop_index = kwargs.get(‘loop_index’, 0) company_name = kwargs.get(‘company_name’, ‘N/A’) founded_year = kwargs.get(‘founded_year’, ‘N/A’) genre = kwargs.get(‘genre’, ‘N/A’) summary = kwargs.get(‘summary’, ‘N/A’)
row_number = loop_index + 2 range_string = f”Sheet1!B{row_number}”
values_to_write = [[ founded_year, genre, company_name, summary ]]
final_data_object = [{ “range”: range_string, “values”: values_to_write }]
return {“result”: json.dumps(final_data_object)} |
|---|
整形されたデータを受け取り、実際にGoogleスプレッドシートの指定されたセルへ書き込みを実行するブロックです。このブロックが完了することで、1社分のリサーチが完了します。
すべてのブロックの設定が完了したら、いよいよ自動化の実行をする時です。まずは画面右上の「公開」ボタンを押し、これまでの作業を忘れずに保存してください。次に、画面左上の「概要」タブへ移動し、「実行」ボタンをクリックすればワークフローが開始されます。
処理が始まると、各ブロックが順番に実行されていく様子がリアルタイムで表示されます。すべてのブロックが緑色のチェックマークと共にエラーなく完了すれば成功の証です。スプレッドシートを開いてみると、A列に入力したURLの横、B列以降に、AIが抽出した企業情報が一行ずつ、書き込まれているはずです。
この自動リサーチシステムは、様々なビジネスシーンで強力な武器となります。例えば、有望な投資先となりうる海外のスタートアップを発掘したり、競合他社や特定市場の動向を継続的に調査したりする際に、その真価を発揮するでしょう。
海外の最新ビジネストレンドを迅速に把握したり、多言語のWebサイトから情報を収集して日本語のレポートを自動作成したりといった用途にも応用可能です。これまで数時間、あるいは数日かかっていたリサーチ業務を、わずか数分で完了させることが可能になります。
今回は、Difyのワークフロー機能を活用することで、「URLの取得」から「AIによる情報抽出と要約」、そして「スプレッドシートへの保存」という一連のプロセスを完全に自動化し、海外企業リサーチの生産性を飛躍的に向上させる方法をご紹介しました。
この仕組みを導入することによって、私たちは煩雑で時間のかかる情報収集作業から解放され、より付加価値の高い「分析」や「戦略策定」といった、人間にしかできない創造的な業務にリソースを集中できるようになります。
この記事が、あなたのビジネスを加速させるための一助となれば幸いです。ぜひ、あなたの手で、この強力な自動化ワークフローを完成させてみてください。
株式会社TWOSTONE&Sonsグループでは
60,000人を超える
人材にご登録いただいており、
ITコンサルタント、エンジニア、マーケターを中心に幅広いご支援が可能です。
豊富な人材データベースと創業から培ってきた豊富な実績で貴社のIT/DX関連の課題を解決いたします。
幅広い支援が可能ですので、
ぜひお気軽にご相談ください!