カテゴリ一 AWS 開発構築 AI

2023-04-03 #Amazon Connect #GPT3 #ChatGPT

昨今耳目を集めるAI業界ですが、今回は特に今アツいAIチャットボットであるChatGPTと電話で話したいと思います。

正確には音声をテキスト化したメッセージを、ChatGPTで利用されているモデルであるgpt-3.5-turboにAPIで送って回答を取得し、Pollyで発話させることで電話でやり取りできるようにします。

音声の入力をAmazon Connect、音声のテキスト化をLex、OpenAIのAPIを叩く部分をLambdaで構築していきます。

構成は下記のようなイメージとなります。

OpenAIのアカウント、APIキーの準備

まずはOpenAIのAPIを実行するために必要なAPIキーを準備します。

OpenAIにアカウントを登録してAPIキーの発行をします。参考→https://platform.openai.com/docs/api-reference/authentication

アカウントの作成は簡単で、私の場合はGoogleアカウントでサインアップ後、電話番号を登録するだけで完了しました。

アカウントの登録完了後、個人ページからAPIキーの取得が可能です。

Lambda

続いて、OpenAI APIにメッセージを送り返答を取得するLambdaを作成します。

ランタイムはPython3.9です。

コードの解説はインラインに記載しています。

import openai
import os

# 環境変数からOpenAIのAPI_KEYを取得
openai.api_key = os.environ['API_KEY']

def lambda_handler(event, context):
    
    if not event['inputTranscript'] :
        # Lexからのinputが空文字、nullなら空のメッセージを返す
        # 結構雑な実装なので改善の余地あり
        return {
            "sessionState": {
                "dialogAction": {
                    "type": "ElicitIntent"
                },
                "intent": {
                    "name": "ConnectToGPT",
                    "state": "Fulfilled"
                }
            },
            "messages": [
                {
                    "contentType": "PlainText",
                    "content": "、"
                }
            ]
        }
    else:
        # OpenAIのAPIをたたく
        query = openai.ChatCompletion.create(
            # 使用するモデルはgpt-3.5-turbo
            model="gpt-3.5-turbo",
            messages=[
                # GPT側のキャラ設定を指定する
                {"role": "system", "content": "あなたは親しい友人です。敬語は使わず、フランクな口調で回答してください。回答は３文までに収めてください"},
                # ユーザーからのメッセージとしてLexからのinputを指定する
                {"role": "user", "content": event['inputTranscript']}, 
            ],
            temperature=0.5,
            max_tokens=100,
            presence_penalty=0.6,
        )
        content = query["choices"][0]["message"]["content"]
        
        # ログ
        print({
            "input": {
                "transcript": event['inputTranscript'],
            },
            "output": {
                "message": content,
            }
        })
        
        # Lex用のフォーマットでOpenAI APIのレスポンスを返す
        return {
            "sessionState": {
                "dialogAction": {
                    "type": "ElicitIntent"
                },
                "intent": {
                    "name": "ConnectToGPT",
                    "state": "Fulfilled"
                }
            },
            "messages": [
                {
                    "contentType": "PlainText",
                    "content": content
                }
            ]
        }

import openai

import os

# 環境変数からOpenAIのAPI_KEYを取得

openai.api_key = os.environ['API_KEY']

def lambda_handler(event, context):

if not event['inputTranscript'] :

# Lexからのinputが空文字、nullなら空のメッセージを返す

# 結構雑な実装なので改善の余地あり

return {

"sessionState": {

"dialogAction": {

"type": "ElicitIntent"

"intent": {

"name": "ConnectToGPT",

"state": "Fulfilled"

}

"messages": [

{

"contentType": "PlainText",

"content": "、"

}

]

}

else:

# OpenAIのAPIをたたく

query = openai.ChatCompletion.create(

# 使用するモデルはgpt-3.5-turbo

model="gpt-3.5-turbo",

messages=[

# GPT側のキャラ設定を指定する

{"role": "system", "content": "あなたは親しい友人です。敬語は使わず、フランクな口調で回答してください。回答は３文までに収めてください"},

# ユーザーからのメッセージとしてLexからのinputを指定する

{"role": "user", "content": event['inputTranscript']},

temperature=0.5,

max_tokens=100,

presence_penalty=0.6,

)

content = query["choices"][0]["message"]["content"]

# ログ

print({

"input": {

"transcript": event['inputTranscript'],

"output": {

"message": content,

}

})

# Lex用のフォーマットでOpenAI APIのレスポンスを返す

return {

"sessionState": {

"dialogAction": {

"type": "ElicitIntent"

"intent": {

"name": "ConnectToGPT",

"state": "Fulfilled"

}

"messages": [

{

"contentType": "PlainText",

"content": content

}

]

}

その他、Lambdaに以下の設定をしておきます。

OpenAIからのレスポンスには数秒の時間がかかるため、タイムアウトは5秒以上を設定
環境変数としてOpenAIのAPIキーを設定

Lex

次はLambdaとAmazon Connectを橋渡しするLexボットを作成します。

Lexでは入力した音声がサンプル発話にヒットした場合にそのインテントが実行されますが、

今回はどんな入力でも受け付けてLambdaに連携したいと思います。

まずは先ほど作成したLambda関数をLexから呼び出せるように設定します。

続いて適当な発話サンプルを持った基本のインテントを作成します

今回は「おはよう」という言葉をサンプル発話に持ったConnectToGPTというインテントを作成します。

また、このインテントのコードフックオプションにチェックを入れて、インテントがLambdaを呼び出すようにします。

さて、これだけでは「おはよう」以外の発話があった場合、FallbackIntentに振り分けられてLambdaに連携されません。

というわけでFallbackIntentのコードフックオプションにもチェックを入れて、どんなときでもLambdaを呼び出すようにしました。

上記のような実装はあまりよくないかもしれませんが、今回はChatGPTで遊ぶことが目的なのでこれで進めていきます。

Amazon Connect

最後にLexを統合したコンタクトフローを作成します。

内容はシンプルで、ログや音声の設定後、Lexの呼び出しを行うのみとなっています。

いざ、実演

準備ができました。

実際に電話してみましょう。（寝起きで録画したのでテンションがとても低いです）

録画の再生はこちら（別タブが開きます）

Amazon Connectなので電話はもちろん、フローをそのまま利用してGPTとのチャットも可能です

さて、それっぽく動作しているように見えますが、実は大きな穴があります

それはOpenAIのAPIを発話の都度呼び出しており、GPT側が発話の履歴を記憶していないため、コンテキストに沿った回答ができないという点です

このあたりについてはDynamoDBに履歴を保存しておき、APIを実行する際に直前の2, 3回分の履歴を合わせてリクエストを送る、などで対応可能そうです

とりあえずChatGPTと話すという目的は達成できたので今回はここまでとしたいと思います

この記事を書いた人
最近の記事

yokomachi

エンジニア：株式会社ギークフィード

エンジニア見習いです。

yokomachi (全て見る)

おすすめガジェット紹介！2024年12月編 - 2024-12-21
Amazon ConnectでNGワードをリアルタイムに検知してSlackに通知する - 2024-12-16
AWS Amplify AI KitでAIチャットアプリを爆速で作ってみる - 2024-12-14
AWS LambdaをC#で実装する（ついでにラムダ式を書く） - 2024-12-09
Amazon Connect Tasksの手動作成と自己割り当て、タスクテンプレートを試してみる - 2024-12-07

【採用情報】一緒に働く仲間を募集しています

2023-04-03 #Amazon Connect #GPT3 #ChatGPT

【Amazon Connect】ChatGPTと電話する【Lex, Lambda】

OpenAIのアカウント、APIキーの準備

Lambda

Lex

Amazon Connect

いざ、実演

【採用情報】一緒に働く仲間を募集しています

エンジニア募集

Asterisk13CLI_チートシート

CentOS7_チートシート

カテゴリー

月別で見る

投稿者から見る

サイト内検索

【Amazon Connect】ChatGPTと電話する【Lex, Lambda】

OpenAIのアカウント、APIキーの準備

Lambda

Lex

Amazon Connect

いざ、実演

【採用情報】一緒に働く仲間を募集しています

関連投稿

2ヶ月で全取得したAWS認定を2ヶ月以内に再認定＆取得し直す

非エンジニアがChatGPTを使ってGASのスクリプトを書いてみた

去年1年間で最も勢いのあったJavaScriptライブラリを見ていく【JavaScript Rising Stars 2024】

Next.jsでAmazon Connectの標準CCPを埋め込み動的データを取得する方法

オフィスにかかってきた電話の内容を生成AIにかませて議事録作成を自動化する

AWS Partner Central API for Sellingを使うための準備と疎通確認してみた

エンジニア募集

Asterisk13CLI_チートシート

CentOS7_チートシート

カテゴリー

月別で見る

投稿者から見る

サイト内検索