Azure AI Studio の発音評価を試してみた
こんにちは!今回のブログ担当は O.M です。
前回の Azure OpenAI を使用した外国語学習アプリを Power Apps で作る の記事に続き、
AI を使用した外国語学習シリーズということで
今回は Azure AI Studio で利用できる、「発音評価」を試してみました。
発音評価を利用する方法は、以下になります。
Azure AI Studio のサイドメニューの [AI サービス] から [音声分析] を選択します。
発音評価の機能では、[読み取り]と[読み上げ]の2つのメニューがあり、
今回は[読み取り]の方を試しました。
サンプルのテキストを読み上げるか、
[独自の入力]ボタンから話したいテキストを自由に入力して、その発音を評価することができます。
評価する言語は、2024年10月20日時点では34の言語から選択することができました。
今回も私は韓国語を選択しました。
サンプルのテキストが少し長かったため、[独自の入力]タブに、
「こんにちは お元気でしたか?」という意味の文章を入れて発音してみました。
発音が完了すると、このように発音スコアやその内訳が表示されます。
再生ボタンをクリックすると、自分の音声を確認することもできます。
各スコアは以下のように評価されるそうです。
正確性スコア:
音声の発音の精度。音素がネイティブ話者の発音とどの程度近いかを示します。単語とフルテキストの精度スコアは、音素レベルの精度スコアから集計されます。
韻律スコア:
指定された音声の韻律。韻律は、強調、イントネーション、話す速度、リズムなど、指定された音声の性質を示します。
流暢性スコア:
指定された音声の流暢さ。単語間の無音の中断に関して、音声がネイティブ話者が使用するものとどの程度近いかを示します。
読み上げるテキストと異なる内容を読み上げると、間違えた箇所が黄色で示され、
どこで間違えたか確認することもできました。
このように音声分析も利用することによって、
言語モデルのみを使用した単語テストや文章の読み取り問題だけでなく、発音練習もできるようになりますね。
今回ご紹介したのは Azure AI Studio 上で試すことができる機能ですが、
この他にも Azure Speech Studio では、
[言語学習]というメニューで、発音評価の機能に GPT-4o、テキスト読み上げアバターなどを組み合わせた
デモを試すことができるようになっていました。
こちらの機能も今後試してみたいと思います。
最後まで読んでくださりありがとうございました。
次回のブログもお楽しみに!