Azure AI Studio の発音評価を試してみた

小山 2024.10.20

こんにちは！今回のブログ担当は O.M です。

前回の Azure OpenAI を使用した外国語学習アプリを Power Apps で作るの記事に続き、
AI を使用した外国語学習シリーズということで
今回は Azure AI Studio で利用できる、「発音評価」を試してみました。

発音評価を利用する方法は、以下になります。

Azure AI Studio のサイドメニューの [AI サービス] から [音声分析] を選択します。

サイドメニューの [発音評価]を選択します。

発音評価の機能では、[読み取り]と[読み上げ]の２つのメニューがあり、
今回は[読み取り]の方を試しました。

サンプルのテキストを読み上げるか、
[独自の入力]ボタンから話したいテキストを自由に入力して、その発音を評価することができます。

評価する言語は、2024年10月20日時点では34の言語から選択することができました。
今回も私は韓国語を選択しました。

サンプルのテキストが少し長かったため、[独自の入力]タブに、
「こんにちはお元気でしたか？」という意味の文章を入れて発音してみました。

発音が完了すると、このように発音スコアやその内訳が表示されます。
再生ボタンをクリックすると、自分の音声を確認することもできます。

各スコアは以下のように評価されるそうです。

正確性スコア：
音声の発音の精度。音素がネイティブ話者の発音とどの程度近いかを示します。単語とフルテキストの精度スコアは、音素レベルの精度スコアから集計されます。

韻律スコア：
指定された音声の韻律。韻律は、強調、イントネーション、話す速度、リズムなど、指定された音声の性質を示します。

流暢性スコア：
指定された音声の流暢さ。単語間の無音の中断に関して、音声がネイティブ話者が使用するものとどの程度近いかを示します。

読み上げるテキストと異なる内容を読み上げると、間違えた箇所が黄色で示され、
どこで間違えたか確認することもできました。

このように音声分析も利用することによって、
言語モデルのみを使用した単語テストや文章の読み取り問題だけでなく、発音練習もできるようになりますね。

今回ご紹介したのは Azure AI Studio 上で試すことができる機能ですが、
この他にも Azure Speech Studio では、
[言語学習]というメニューで、発音評価の機能に GPT-4o、テキスト読み上げアバターなどを組み合わせた
デモを試すことができるようになっていました。

こちらの機能も今後試してみたいと思います。
最後まで読んでくださりありがとうございました。
次回のブログもお楽しみに！

小山の最新の記事

ChatGPTと勉強してTOPIK3級に合格した話

こんにちは。今回は、AI「ChatGPT」とネイティブの先生、両方の力を借りてTOPIK3級に合格した体験談をお届けします。 AIを使った語学学習に興味のある方の参考になれば嬉しいです。 TOPIKとは？ TOPIK（Test of Proficiency in Korean）は、韓国語を母語としない人向けの韓国語能力試験です。級は1級～6級に分かれ、数字が大きいほど難易度が上がります。 TOPIKには「TOPIK I（1・2級）」と「TOPIK II（3～6級）」があります。 TOPIK I（1・2級）：初級者向け。リスニングとリーディングのみ。 TOPIK II（3～…

小山 2025.06.20
弘前公園の夜桜

先日、弘前公園の夜桜を見に行ってきました。外濠の桜はちょうど満開で、ライトアップされた桜が水面に映り、とても幻想的な雰囲気でした。夜にもかかわらず花見客で賑わっていて、出店にも行列ができていたり、活気にあふれていました。個人的おすすめの出店メニューは「亀屋のたこ焼き」と「おさつスティック」です🐙 満開の桜と夜のにぎわいに包まれて、心がほっとするひとときでした。【参考】弘前さくらまつりまつり期間中は、通常のライトアップに加えさくらの見どころを特別ライトアップします。【ライトアップ期間】2025年4月16日(水)～5月5日(月祝) 【ライトアップ時間】日没～22:00

小山 2025.04.23
Soraで旅行Vlogを作ってみた

こんにちは。今回のブログ担当は小山です。先日、長崎さんが投稿した動画生成AI「Sora」で「新年のご挨拶」動画を作ろうの記事に続き、今回も動画生成 AI の Sora をテーマにしたブログです。だんだん春らしい天候の日が増えてきて、どこかに出かけたい気分になりますね。とはいえ、すぐに旅行に行けるわけではないので、Sora で旅行 Vlog 風の動画を作ってみました。 Sora へ送信するプロンプト作成は GPT-4o に手伝ってもらいました。動画はスマホで撮影したイメージで、縦長の比率に設定しました。スイスの高原でのんびり過ごす旅まずはスイスに行って、「これぞ絶景」な旅行をしたい…

小山 2025.03.23
Azure OpenAI Service × Power Automateで実現する、毎朝のニュースチェックフローを作ってみた

こんにちは！今回のブログ担当は小山です。今回は、AI が毎朝最新ニュースを要約して教えてくれる Power Automate のフローを作成したので、その手順をご紹介します。フロー全体の流れ Bing Search APIでニュース記事を取得 Bing Search APIを使うと、特定のカテゴリに合わせたニュース記事を簡単に取得できます。なお、カテゴリの選択肢はMarketによって異なります。例えば、日本のMarketでは以下のカテゴリから選べます。 Business Entertainment Japan LifeStyle Politics ScienceAndTechnolog…

小山 2025.02.02
OpenAI の動画生成モデル Sora を使ってみた

こんにちは！今回のブログはO.Mが担当します。先日、OpenAIの動画生成モデル「Sora」が一般公開されました。早速、私も試してみたので、その流れをご紹介します。 ※今回の内容はAzure OpenAI上で操作したものではなく、OpenAIのサービスを使用したものです。まず、Soraにアクセスすると以下のようなページが表示されます。この画面の下部にあるプロンプト入力欄に、生成したい動画の内容をテキストで入力します。プロンプトの他に、動画の比率や解像度、長さなども設定可能です。 ChatGPTのPlusプランでは、最大10秒の動画を生成できま…

小山 2024.12.20
Azure OpenAI Service「プロンプトを生成する」機能を試してみた

こんにちは！今回のブログは O.M.が担当します。 Azure OpenAI Studio のチャットプレイグラウンドに「プロンプトを生成する」機能が追加されていたので早速試してみました。以下のように、画面左側のセットアップを行うスペースに「プロンプトを生成する」ボタンが追加されました。このボタンをクリックすると、モデルに何をしてもらいたいのかを入力できるようになります。今回は簡単に「お悩み相談」とだけ入力しました。すると、数秒でプロンプトを生成してもらうことができました。「モデルに指示とコンテキストを与える」の箇所に、生成されたプロンプトが自動でセットされます。実際に生成された…

小山 2024.11.15
Azure OpenAI を使用した外国語学習アプリを Power Apps で作る

こんにちは！今回のブログはO.M.が担当します。前回のブログでは、Azure OpenAIを活用した外国語学習方法をご紹介しました。前回紹介した学習方法を、今回は Power Apps をインターフェースにして行えるようにキャンバスアプリを作成しました。こちらが実際のキャンバスアプリの画面です。習熟度レベルと問題形式を送信すると、Azure OpenAI が問題を出題します。システムプロンプトの中で、ユーザーが解答を送信したら、正解を教えるように指示しています。以下のように解答を送信すると、答え合わせができます。チャットを新しく始めたい時は、画面下部のほうきのボタンをクリックす…

小山 2024.09.22
Azure OpenAIを活用した外国語学習方法

こんにちは。今回のブログ担当はO.Mです！今回は、Azure OpenAI を利用して、外国語学習を効果的に行う方法について考えてみました。習熟度レベルの設定 Azure OpenAI で外国語の学習をするにあたり、まずは自分の習熟度をモデルに伝えて、学習状況に沿った問題を生成してもらう必要があると考えました。そこで、どのように習熟度レベルを伝えるべきかを GPT-4o に質問し、初級〜ネイティブまでのレベルを作ってもらいました。私はこれまでK-POPとAIに関する記事をいくつか投稿していましたので、今回の学習言語は「韓国語」にしました。 GPT-4o が生成した、学習者の習熟度レ…

小山 2024.08.25
チッケムって知っていますか？

こんにちは！今回のブログは、O.M が担当します。以前こちらの記事で、AI を使用したミュージックビデオについてお話ししましたが、今回もK-POPとAIに関するお話をしたいと思います。チッケムって知っていますか？みなさん、「チッケム」をご存知ですか？日本語に直訳すると「直カメラ」という意味なのですが、「一人のメンバーだけを追って撮影した動画」のことです。「推しカメラ」や「FanCam（ファンカメラ）」とも呼ばれたりします。 Copilot にも聞いてみました。 Copilot が説明している通り、元々はコンサートや音楽番組で、ファンが特定のメンバーを撮影した動画のことを指す言…

小山 2024.07.28
16personalities、試したことはありますか？

皆さんこんにちは！今回のブログがO.Mが担当します。今日は性格診断ツールである「16personalities」についてご紹介します。 16personalitiesとは？ 16personalitiesは、個人の性格を16種類のタイプに分類することで、自己理解や他者との関係構築に役立つツールです。こちらからテストを受けることができます。 16personalitiesの4つの軸 16personalitiesは以下の4つの軸で構成されています。それぞれの軸は二つの対立する性質を持ち、組み合わせによって16種類の性格タイプが導き出されます。・外向（Extraversion: E）と内…

小山 2024.06.30