![Blog Admin](https://pxa.xsrv.jp/test103/wp-content/uploads/2018/11/icon001.png)
先の累積更新で実装されていた、日本語のライブキャプションを使ってみました。
日本語字幕に対応していない動画に重宝しそうです。
![壁紙](https://pxa.xsrv.jp/test103/wp-content/uploads/2021/10/img19-300x188.jpg)
Windows 11
ライブキャプション
動画でも歌でも、システムから出力されている音声は文字おこしできます。
コピーなどはできません。
精度はまあまあです。
設定の備忘録です。
アクセシビリティ機能
字幕を出してくれる機能です。
システム音声を拾って文字にしてくれます。
流れていく情報です。
もともとライブキャプション機能はありましたが、このほど、日本語に対応しました。
初期設定ができたら、機能をオンにするだけで使えます。
初期設定の方法は次項にて。
ライブキャプションの起動方法は以下です。
設定 → アクセシビリティ → 字幕
ライブ キャプション をオン
Win + Ctrl + L
すぐにスタートできます。
ライブキャプションの始め方
初期設定です。
備忘録です。
まずは機能をオンにするところからです。(場所は既述のとおり)
最初の起動の時にだけ、言語ファイルのダウンロード案内があります。
ダウンロードするということは、ライブキャプションを利用することに同意するということです。
表示関係の設定変更が可能です。
言語ファイルのダウンロード
ライブキャプションをオンにすると、最初は、ダウンロードボタンが表示されます。
ボタンになっている理由は、利用規約を承諾させるためでしょう。
![初回ダウンロード](https://pxa.xsrv.jp/test103/wp-content/uploads/2023/07/image-5-300x157.png)
言語はシステムからデフォルト値をとってきているものと思われます。
日本でよいですよ。
今回の新機能ですからね!
![設定](https://pxa.xsrv.jp/test103/wp-content/uploads/2023/07/image-6.png)
ダウンロードが終われば、最低限のことは終わりです。
デフォルトだと画面上部にキャプションウィンドウが表示され、ライブキャプションが開始されます。
システムから音声が出力されていなければ、当然のことながらだんまりです。
表示位置調整
画面右上の歯車アイコンが設定です。
最近のトレンドですね。
![表示位置](https://pxa.xsrv.jp/test103/wp-content/uploads/2023/07/image-7-300x198.png)
設定内の「位置」にて、キャプションウィンドウの表示位置を変更できます。
画面の上部に固定するか、下部に固定するか。
あるいはフローティングウインドウにするかです。
「画面に重ねて表示」は、キャプションの位置を自由に変更できます。
最前面表示です。
言語選択(追加)
表示できる言語を追加できます。
言語は単一選択方式です。
![字幕言語](https://pxa.xsrv.jp/test103/wp-content/uploads/2023/07/image-8-300x157.png)
必要に応じて、対応言語を増やせます。
でっフォルトでは日本語ですが、英語を追加とかいったことが可能です。
英語を追加してみました。
![追加する言語](https://pxa.xsrv.jp/test103/wp-content/uploads/2023/07/image-9-261x300.png)
言語によってマークの数が異なっています。
ライブキャプションに対応していないと使えないですね。
![言語のダウンロード](https://pxa.xsrv.jp/test103/wp-content/uploads/2023/07/image-10-262x300.png)
追加の言語ファイルをダウンロードしたら、ライブキャプションで選択できるようになります。
地域と言語 のところに入ってきます。
字幕が出るが
動画でも、音声ファイルでも、字幕になります。
選択した言語で表示してくれるのです。
2行出ていて住み分けは謎ですが、精度は悪くないと思います。
日本語だけならなんとか
![メガホン](https://pxa.xsrv.jp/test103/wp-content/uploads/2020/09/megaphone-003-300x187.jpg)
日本語だけの音声なら。
映像でも音楽でも。
ただし、きれいなことば、きれいなイントネーションです。
節が付いていたり、イントネーションが違ったり、英語が混ざっていたりすると、うまく文字にできません。
文書にしてくれようといった努力は見えます。
カタカナ混合は崩壊
ある程度のカタカナ語は把握してくれているように見えました。
登場する位置の前後のことばや、周りの人の反応など、見極められているのでしょうか。
細かい情報を保存するような仕組みはないように見えているのですが。。
![ライブキャプション](https://pxa.xsrv.jp/test103/wp-content/uploads/2023/07/image-11-300x53.png)
英語っぽいカタカナでも、カタカナ語として認識されないことが多々あります。
結果として、固有名詞が多い会話や、節のついた音楽などでは、キャプションはめちゃくちゃです。。
字幕非対応でも
最近は字幕対応の動画が増えましたが。
もし非対応の動画だとしても、これなら雰囲気は伝わりやすい気がしております。
安定した結果を得られるわけではないものの、雰囲気は分かるかもしれません。
![テレビ](https://pxa.xsrv.jp/test103/wp-content/uploads/2017/07/TV-015-300x200.jpg)
フィードバックはよいのでしょうか。
Microsoftにデータ送付してもよいような気もします。
安心材料として、ユーザーの分かるようなかたちでデータは送っていないということなのでしょう。
もう少し活用方法は考えてみましょうか。
ご意見やご感想などお聞かせください! コメント機能です。