パソナについて
記事検索

生成AIの力を借りてナレッジベースを構築した話

株式会社パソナ Web/AIチームの石黒です。
生成AIについて目まぐるしいほど環境が変わる昨今ですが、筆者は環境を構築した事がありませんでした。
そこで本日は生成AIを触った事が無い私が生成AIの助けを借りながらAWS Amplify Gen 2 と AWS CDK でナレッジベース環境を構築した内容をご紹介します。

生成AIの力を借りてナレッジベースを構築した話

株式会社パソナ Web/AIチームの石黒です。
生成AIについて目まぐるしいほど環境が変わる昨今ですが、筆者は環境を構築した事がありませんでした。
そこで本日は生成AIを触った事が無い私が生成AIの助けを借りながらAWS Amplify Gen 2 と AWS CDK でナレッジベース環境を構築した内容をご紹介します。

知識・情報

2025/04/25 UP

普段は管理業務をしているのですが、これでも昔はAWSを触っていたエンジニアでして、
前々から生成AIの環境を簡単に構築できたら良いなと考えていました。
そんな中でこちらの記事を見まして、これだったら作れるかな?という事で試してみました。

目標作り

・1のクライアント部分を、Windows+ubuntuで実現する
・2はナレッジベースを導入して、出来るだけ安く構築する
・エラーは全て生成AIで解決する

ubuntuで構築

全て記載すると大変なので時間のかかった箇所をメインに記載していきます。

Ubuntuのインストールは割愛しますが、特に困ったのは
ところどころコマンドがWindows側にインストールしたコマンドを実行してしまう事でした。
こちらはWSL2でWindowsのPATH設定が引き継がれるのを解除する事で解決。

その後の手順は引用元の通り進めると、いくつかエラーになります。
エラー対応させる生成AIはGeminiにしました。

例えばこんなエラーの時
deprecated @aws-amplify/backend-secret@1.3.0: backend-cli 1.6.0 does not work with Amplify Hosting service

このようにエラーメッセージを投げると的確に回答してくれます。
体感として8割ぐらいは正解を教えてくれるのですが、大体はモジュールの問題>環境の問題という順番で提案してくるので、
前述のようにWSL環境の問題に辿り着くには時間がかかる傾向があります。

バックエンドの設定

続いてこちらの設定

モデルアクセスで他を使いたい場合はどこを見れば良いのか
コンソールを確認すると、まったく同じ名前では無い模様。

これについては、@cdklabs/generative-ai-cdk-constructsのソースを確認する必要がありました。
参考
※ただしこの手順ではモダリティが「埋め込み」とされているものだけ使えるようでした。

料金を安くしたい

そんなこんなでナレッジベースの構築が出来たのですが、
2の出来るだけ安く構築する壁がありました。

OpenSerchで1日8ドルほど使っているので、1か月240ドルぐらいです。
現状ではこれが一番安いものになります。

以下は、OpenSerch Serverlessの
Collectionsの設定でデプロイタイプを開発/テストモードで作成する時の項目になります。
※作成後に変更は出来ない項目になります。

感想

・エラー内容を生成AIに投げると答えられないものもありますが、8割程度は正しい回答を貰えるのでストレス無く構築できました。
・Windows+Ubuntuが思ったより動作が早く快適でした。
・今度はフロントエンド部分を凝って作りたい

最後になぞなぞを解いてもらいました。

本当は12と答えて欲しかったのですが、ちょっと頑固みたいですね(笑)

最後までお読みいただきありがとうございました

この記事を書いたメンバー

nazonazo9

Web/AIチーム 石黒 和哉

求人について

また、弊社では次世代の技術を牽引する人材を募集しています。
あなたのスキルと情熱を活かし、私たちと一緒に未来のビジネスを築き上げましょう。

エンジニアの求人
https://x-tech.pasona.co.jp/recruit/career/jobs/