別動画で「Linux って意味あるの?」として Linux でしか出来ないことをお話しました。
正直なところ Windows や macOS のほうが、デスクトップ OS としてできることが多いのはたしかです。
そこで Linux でもできることの具体例を紹介していこうと思い、ネタを探していて真っ先にコダシマに刺さったのが、無料で使えるテキスト読み上げソフト。
いわゆる「音声合成ソフト」です。
Linux でも使えるものがあったので紹介いたします。
VOICEVOX 無料で使える中品質なテキスト読み上げソフトウェア
結論から言うと、もうご存知の方もおられるかと思いますが、今回紹介するのは VOICEVOX です。
VOICEVOX は、2021年8月1日にヒホ(ヒロシバ)さんによってリリースされたオープンソースの中品質テキスト読み上げ用音声合成ソフトウェアです。
AI によるディープラーニングをシステムに組み込んでおり、文字単位での細かなイントネーションの調整などが行えます。
2023年1月現在、Version 0.13.4 の VOICEVOX は、キャラクターごとに利用規約がありますが、規約を守れば商用・非商用問わず無料ですぐに使うことが出来ます。
しかも、Windows と macOS だけでなく Linux でも使うことが出来ます。
後でもう少し詳しく紹介しますが、イントネーションなどの詳細な調整ができるため、ちゃんと作り込むと「これがホントに無料で良いの?」というレベルの音声合成が出来るスゴいソフトウェアです。
無料で商用利用することが可能なオープンソースのため、自由にプログラムの改変や再配布が可能となっており、「ロボットなどに組み込んで対話型のシステムを作る」「観光案内システムに導入して喋らせる」「クラウド型のシステムを構築し、ブラウザを経由して対話できるようにする」などといった様々な応用が可能であるというのも忘れてはいけません。
また、合成できる音声は、東北地方を応援するキャラクター「東北ずん子」の公式作品に登場する関連キャラクター「四国めたん」や「ずんだもん」をはじめとした現在19のキャラクターの声を使って音声を合成することができます。
アニメ声のキャラクターだけでなく、落ち着いた音声のキャラクターもいるので幅広い用途に使えます。
- 東北ずん子 – https://zunko.jp/
- ずんだホライずん – https://zunko.jp/con_ani.html
といったあたりで、早速 VOICEVOX を使ってみましょう。
VOICEVOX をインストール。
今回 VOICEVOX をインストールする Linux は、定番の Ubuntu です。
さっそく始めましょう。
まず、トップページの、ダウンロードボタンをクリックするとダウンロードの選択画面が表示されます。
「OS」、「対応モード」、「パッケージ」をそれぞれ選択してダウンロードしましょう。
OS はもちろん「Linux」です。
対応モードには「GPU/CPU」と「CPU」の2つのモードが用意されており、GPU 版は GPU 搭載の Windows PC と、Nvidia 製 GPU 搭載の Linux PC に対応しています。
どちらのモードかわからないときは、「CPU」モードを選んでおくと間違いないです。
また Linux 版の CPU モードを選ぶと、パッケージは「インストーラー」か「tar.gz」が選べますが、インストーラーのほうが使い方が簡単なので、今回はインストーラーをダウンロードします。
「VOICEVOX.Installer.0.x.x.Linux.sh」ファイルがダウンロードされます。
このインストーラーは、bash スクリプトになっているため sh や zsh で実行するとエラーになります。
ファイルのアクセス権を変更して実行するのが定番なのですが、今回はちょっと違う方法で、このファイルを実行します。
ファイルの上で右クリックし「プロパティ」⇒「アクセス権」⇒「プログラムとして実行可能」にチェックを入れておきます。
このファイルの準備はこれだけです。
それと、ターミナルを開いて、システムの準備をしておきましょう。
Ubuntu の場合、初期設定のままだとインストール中にエラーが出て中断されたり、インストールが終わっても VOICEVOX が起動しなかったりします。
それを防ぐため、前もって
- curl
- p7zip
- fuse
- libfuse2
を、インストールしておきます。
他の Linux ディストリビューションもそうだと面倒だなぁ…とか思い、メジャーな Linux で試してみましたが、実は Linux でいちばんインストールが面倒だったのが Ubuntu でした。
初心者向けとされる Linux Mint や Zorin OS、Pop!_OS や MX Linux、Manjaro なんかも試してみましたが、これら有名な Linux のほとんどは、これから紹介する手順だけでインストールできました。
必要なパッケージのインストールが終わった段階で、ファイルのアクセス権を変更したファイルを、開いているターミナルにドラッグ&ドロップ⇒エンターキーを押すことでインストールが始まります。
今の Linux はターミナルでこんな使い方ができるようになっています。
意外と便利で初心者向けの操作方法ですが、初心者ほど知らなかったりします。
何れにせよ、インストールが終わったらアイコンをクリックすれば VOICEVOX が起動します。
起動にちょっと時間がかかるため、微妙に不安を感じますが、AppImage 形式の宿命だと思いましょう。
はい、ということで VOICEVOX のインストールができました。
基本的に AppImage 形式のアプリケーションなので、この形式のアプリケーションが動作する環境であれば問題ありません。
メジャーな Linux ディストリビューションでチェックしてみましたが、概ねインストールから起動まで、追加パッケージを必要としないものがほとんどでした。
しかし今回の Ubuntu のように、何かしらパッケージが不足している場合があるので、その際にはここらへんの AppImage を動作させる環境まわりを確認してみてください。
VOICEVOX を使ってみた。
VOICEVOXを起動すると、まず「利用規約に関するお知らせ」が表示されます。
ちゃんと一読しておきましょう。
んで「同意して使用開始」ボタンをクリックすると、「追加キャラクターの紹介」画面が表示され、各キャラクターのサンプルボイスを確認することができます。
また、画面右側にある「キャラクター並び替え」ではドラック&ドロップでキャラクターの表示順序を変更することができます。
「完了」ボタンをクリックすると「使いやすさ向上のためのお願い」が表示されます。
こちらも一読しておきましょう。
んで「許可」ボタンをクリックすると、いよいよ音声合成が出来るようになります。
データの保存や音声の出力は「ファイル」で行います。
「音声の書き出し」は、デフォルトだと一行ずつ番号が振られて書き出され、「一つだけ書き出し」は選択されている行の音声のみを書き出します。
「音声を繋げて書き出し」を選ぶと、全ての行が一つの音声ファイルとして書き出されます。
「エンジン」では、「再起動」とありますが、CPUモードとGPUモードを切り替えたり、音声合成の編集の際にトラブルがあったときなどに使うようです。
「設定」では、キーボードショートカットの設定や確認を行う「キー割り当て」や、画面に表示するボタンを編集する「ツールバーのカスタマイズ」、「キャラクター並び替え・視聴」、「デフォルトスタイル」、「読み方&アクセント辞書」が並びます。
おおまかな設定は「オプション」の項目で行うことができます。
こんな感じです。
エンジンモードの変更や、操作について、データの保存方法などの設定はここで行います。
という感じで、いよいよ音声合成をやってみましょう。
VOICEVOX で音声合成。
操作方法はとても簡単で、わりと直感的に使うことができます。
使い方はざっくりいうと、キャラクターを選んで、テキストを入力するだけです。
細かくアクセントやイントネーション、長さの変更ができるので、しっかり設定すると、違和感のない音声を作ることができます。
音声合成が一通りできたら、音声ファイルを書き出しましょう。
という感じで、使えば使うほど、とても無料とは思えないソフトウェアです。
実は Linux にも、いくつか音声合成ソフトはありましたが、すべてコマンド入力で操作するものばかりでした。
が、時代が変わりましたね。
これでまたひとつ、Linux で出来ることを知りました。
VOICEVOX のまとめ。
今回は Linux でも使える音声合成ソフト VOICEVOX を紹介しました。
使いやすく多機能なうえ、Linux でも使えるというホントに無料で良いの?というソフトウェアです。
Ubuntu の場合、初期状態だと VOICEVOX のインストールに必要ないくつかのパッケージが不足しているため、そのままインストールしようとすると、インストールが途中で止まったり、インストールが終わっても起動しなかったりするため、予め以下のパッケージを追加しておくと、インストールから起動まで問題なく動作するようになります。
- curl
- p7zip
- fuse
- libfuse2
使い方を確認するために Shorts をいくつか使ってみたのですが、ここまですごいとは思いませんでした。
Softalk の無機質でいかにも!という音声も悪くはないですが、無料なのに自然な音声が合成でき、なにより Linux でも普通に使える VOICEVOX のほうがコダシマには魅力的に感じます。
Youtube を始めとして VOICEVOX を使った動画や音声が、これからもっと量産されそうですね。
興味を持った方は是非チェックしてみてください!