ミンティアのスペシャルコンテンツで音声感情解析AI「Empath」が採用
「ミンティア+VOiCE レモンジンジャー」は、アサヒグループ食品株式会社様が国内大手の声優事務所アイムエンタープライズ社と共同開発した、声優公認のどタブレット。声優に人気の桔梗エキス、ビタミンC、のど飴を細かく粉砕したキャンディチップも配合し、“いい声”の状態をサポートします。その「ミンティア+VOiCE レモンジンジャー」のユニークな企画『あなたの声の印象がわかる!「ボイプレッション診断」by MINTIA + VOiCE』でCACの音声感情解析AI「Empath」が活用されました。
こちらでは、ミンティアでの「Empath」活用の様子をレポートします。
『あなたの声の印象がわかる!「ボイプレッション診断」by MINTIA + VOiCE』とは
「ミンティア+VOiCE レモンジンジャー」では、2024年11月1日にビジネスパーソンを対象に実施した声に関する意識調査の結果を発表、同時にスペシャルコンテンツ『あなたの声の印象がわかる!「ボイプレッション診断」by MINTIA + VOiCE』(以下、「ボイプレッション診断」)を公開しました。「ボイプレッション診断」は、ビジネスボイストレーナーの秋竹朋子先生監修のもと、指定のセリフを吹き込むと、9つの声タイプから自分の声タイプの診断ができるコンテンツです。
▼ 【声に関する意識調査】第一印象には“ファーストボイプレッション”が重要!ビジネスパーソンの約9割が、声が相手の印象を左右すると回答 声はビジネススキルに含まれると86.2%の人が感じていることが判明
▼ 『あなたの声の印象がわかる!「ボイプレッション診断」by MINTIA + VOiCE』
※2024年12月末まで公開予定
「ボイプレッション診断」の使い方
「ボイプレッション診断」では、まず性別を選んでから診断を開始します。表示される例文をPCやスマホのマイクに向かって読み上げます。デバイスのマイクの使用を許可して診断してください。
画面の表示に従って読み上げた声を「ボイプレッション診断」が判定、その後分析の結果が表示されます。
診断結果では、声のタイプ別に与える印象や特徴、おすすめのいい印象に繋がる声の出し方が表示されます。さらに、秋竹先生によるビジネスシーンや日常でも役立つアドバイスも表示されます。
「ボイプレッション診断」でのEmpath活用
「ボイプレッション診断」で例文を読み上げる声の分析に利用されているのが、CACの音声感情解析AI「Empath」です。
音声感情解析は、人の声をAIが分析して感情を判定する技術です。
Empathは、音声の中から雑音や発話がない部分を切り取り発話のみを検知して、声のスピード、抑揚、トーンなどの物理的な特徴量から気分の状態を独自のアルゴリズムで判定します。数万人の音声データベースをもとに喜び・平常・怒り・悲しみの4つの感情と元気度の合計5つの指標で分析を行います。
今回の「ボイプレッション診断」では、声タイプの判定にEmpathが用いられており、声が与える印象にもEmpathが解析した指標の情報が利用されています。
Empath の正確な音声感情解析技術と、声のプロであるビジネスボイストレーナーの専門性が見事にマッチして今回のユニークな企画が実現しました。
自分の声はどんな印象か? ぜひ『あなたの声の印象がわかる!「ボイプレッション診断」by MINTIA + VOiCE』でお試しください。
▼ 『あなたの声の印象がわかる!「ボイプレッション診断」by MINTIA + VOiCE』
※2024年12月末まで公開予定
様々な業界で活用が進む「Empath」
「ボイプレッション診断」で採用された音声感情解析AI「Empath」は、人が話す言葉の意味内容ではなく、声の物理的な特徴量による声の状態で感情を分析します。そのため、日本語や英語など言語を問わずに分析が可能で、これまでに世界50ヵ国、4,300社以上で利用されています。
幅広く利用されるEmpathはリアルタイムでの解析が可能で、感情解析のモデルのチューニングが可能な点に特徴があります。また、分析結果は視覚的に表すこともできます。
Empathは今回の「ボイプレッション診断」のようなエンターテインメントの分野だけでなく幅広い分野での活用が進んでいます。また、CACでは、様々な業界向けにEmpathの技術を活用したサービスを提供しています。
コールセンター業界向けには、オペレータケアや通話品質評価の効率化をサポートするコールセンター向けAIソリューション「Beluga Box SaaS」を提供しています。Beluga Box SaaSは、オペレーターの声から元気度の測定や、顧客満足度の測定、通話品質の自動評価など多数の機能を備えています。
▼ コールセンター向け感情解析「Beluga Box SaaS」
また、ゲーム開発の分野では、音声から3Dキャラクターの表情アニメーションを自動生成する「DeepEmo」のデモエディタの提供を2024年12月から開始しました。
DeepEmoは、これまで3Dゲームのキャラクターの表情生成を支援するサービスとして、Empathを活用して音声データから解析した感情値をCSVファイルでお客様に提供しており、ある大手ゲーム開発企業様では表情アニメーション制作の約95%の工数を削減した実績があります。しかし、効率等の点から実際の開発現場への導入に課題を感じるというお客様からの声もいただいていました。
そこで、このデモエディタはゲームエンジンUnityのプロジェクトとして提供することで、AIによる台詞音声の解析と感情データの出力、そして感情データをもとにした3Dキャラクターの表情アニメーション自動生成までの一連の工程を体験できるものとして開発しました。
CACでは今後、このデモエディタのゲーム開発現場での活用結果を受けて開発現場の多様なニーズに応えていく予定です。
▼ プレスリリース「音声感情解析AIによる3Dキャラクター表情自動生成サービス「DeepEmo」のUnity版デモエディタの提供を開始」
今後もCACは、音声感情解析AIを様々な業界のより多くのお客様が、より利用しやすくなるようサービスの改善を続けてまいります。
音声感情解析AI「Empath」の詳細は以下をご覧ください。