今回はVideo Indexerを紹介したいと思います。
Video IndexerはMicrosoft Azureの製品の「AI + Cognitive Services」にある1つのサービスになります。
簡単に説明すると「人工知能技術を使用してビデオから洞察を抽出することを可能にするクラウドサービス」になります。
では、どんな「洞察を抽出」できるか・・・
いろいろ抽出してくれます!!
いきなりですが、サービスを利用したページのキャプチャーになります。
このサイトは「PAGEONE LABO.」の「AI × 動画解析」より「デモサイトを見る」から利用できますので、
是非、見て!!さわって!!ください。
以下はVideo Indexerの概要になります。
1.オーディオ転記
スピーチからテキストへの変換機能があり、発言の記録を取得できます。
2.顔の追跡と識別
ビデオ内の顔の検出し検出された顔は、有名人データベースと照合され、ビデオにどの有名人が存在するかを評価します。
また、有名人にマッチしない顔にラベルを付けることもできます。
3.スピーカーインデックス
どのスピーカーがどの単語をいつ話したかをマップして理解する機能があります。
4.視覚的なテキスト認識
ビデオに表示されるテキストを抽出します。
5.音声アクティビティ検出
バックグラウンドノイズと音声を分離できます。
6.シーン検出
ビデオのビジュアル分析を実行して、ビデオ内のシーンがいつ変化するかを判断する機能を備えています。
7.キーフレーム抽出
ビデオ内のキーフレームを自動的に検出します。
8.感情分析
音声テキストと光学式文字認識を使用して抽出されたテキストのセンチメント分析を実行します。
その情報をタイムコードとともに中立的な感情の否定的な形で提供します。
9.翻訳
言語から別の言語への音声トランスクリプトを翻訳する能力を持っています。
英語、スペイン語、フランス語、ドイツ語、イタリア語、簡体字中国語、ポルトガル語ブラジル、日本語、ロシア語の言語がサポートされています。
翻訳後、ユーザーは他の言語の動画プレーヤーで字幕を取得することもできます。
10.視覚的コンテンツの調整
ビデオに存在する成人および/または猥褻な物質の検出を可能にし、コンテンツフィルタリングに使用することができる。
11.キーワード抽出
音声テキストと視覚的テキスト認識ツールで認識されたテキストをキーワードとして抽出します。
これらの事を動画をUPするだけで行ってくれます。
利用するには、以下のURLでログインし直ぐに利用できます。
https://vi.microsoft.com/
ログイン後に動画をUPししばらく待つと・・・使えます!!
物凄く簡単で直ぐに使える点がいいですね。
概要の内容はAPIを利用してほとんど取得できます。
動画up後の編集やAPIの利用等に関しては次回にご紹介したいと思います。