この記事では、次のような疑問や悩みに答えます。
- テキストやPDF、画像など様々なデータを読み上げてくれるソフトウェアを探している。
- iMyFoneのAIテキスト読み上げソフト「VoxBox」がどのような製品か知りたい。
文字データ(資料のようにテキストで書かれた情報)を理解するには自分の目で文字を見る必要があります。
当たり前のことですが、文字を目で見るということは、椅子に座っている時や電車の中で座っている時など、基本的に止まった状態でなければいけません。(動いている状態で、文字を読んでいると危険ですよね)
一方で、文字データが音声データになれば、動いている状態(移動中やランニングなど)でも聴く事はできるので理解することが可能になります。つまり時間の有効活用につながります。
そう考えると、文字データを音声データに変換してみたくなりませんか?
そこで本記事では、テキストやPDF、画像など様々なデータの読み上げが可能な、iMyFoneのAIテキスト読み上げソフト「VoxBox」を紹介します。
「VoxBox」は、テキストだけではなく、PDFファイルや文字の含まれた画像ファイルといった様々なデータを音声データに変換できるソフトウェアです。
46種類以上の言語、3200個以上のボイスを使って表現力豊かな音声データを作成可能です。MP3、WAVをはじめ、様々なフォーマット形式に対応しています。また、音声データへの変換だけでなく、音声データからの文字起こしや、その他の機能も有しています。
記事では、製品の概要から実際の使い方まで紹介します。
お試し可能な無料版も用意されていますので、まずは実際に使ってみて、気に入ったら購入するというので良いと思います。
iMyFoneのAIテキスト読み上げソフト「VoxBox」とは
製品概要
「VoxBox」は、iMyFone社が提供するAIテキスト読み上げソフトです。
46種類以上の言語、3200個以上のボイスを使って表現力豊かな音声データを作成可能です。MP3、WAVをはじめ、様々なフォーマット形式に対応しています。
音声データへの変換をはじめ、以下の通り豊富な機能を有しています。
- 文字読み上げ(テキストやPDF、画像にある文字の識別と音声変換)
- ボイスレコード(PC上の音声を録音)
- ビデオコンバータ(メディアファイルを任意の音声形式に超高速で変換)
- 音声編集(音声クリップの切り取りや削除)
- 文字起こし(音声データをテキストに変換)
- ボーカル除去(音楽のボーカルトラックと特定の楽器のパートを分離して抜き出し)※近日公開予定
詳細は以下の公式サイトで確認できます。

ライセンスについて(無料版あり)
「VoxBox」には、有料版だけでなく無料版も用意されています。
無料版は、有料版と比べて読み上げる文字数が3000文字まで、文字起こしの時間が3分までといった形で制限はありますが、主要な機能に関しては有料版と同じように使用可能です。まずは無料版で試してみて気に入ったら有料版を購入するというので良いと思います。
無料版と有料版の違いは以下の公式サイトで確認できます。

有料版には、月額ライセンスと年間ライセンス、永久ライセンスの3種類が用意されています。どのライセンスも3台のパソコンで利用可能です。長く使うのであれば永久ライセンスがおすすめです。
以下の公式サイトで、ライセンス価格の確認やライセンスの購入が可能です。

「VoxBox」のインストール方法
インストール方法
「VoxBox」のインストール方法を紹介します。
以下の公式サイトにアクセスします。

アクセスしたサイトで、「無料ダウンロード」をクリックします。

インストーラーファイルがダウンロードされます。
インストーラーファイルをダブルクリックで実行します。

「VoxBox」のインストーラーが起動します。
「インストール」をクリックします。

インストールが開始されます。
しばらく待ちます。

インストールが完了すると以下の画面が表示されます。
「今すぐ開始」をクリックします。

「VoxBox」のソフトが起動します。

これでインストールは完了です。
この時点では、無料版として使用できる状態になっています。
ライセンス登録(有料版に変更)
とりあえず無料版で使用する場合は、本説明は飛ばしてください。
ここでは、無料版から有料版に変更(ライセンス登録)する方法を説明します。
「VoxBox」ソフトの右上にある人型のアイコンをクリックします。

ライセンスを登録するためには、アカウント作成が必要になります。
アカウントを作成するために「新規登録」をクリックします。

メールアドレスなどの必要事項を入力し、「アカウント」作成をクリックします。

アカウントが作成され、自動的にWebブラウザが立ち上がり以下の画面が表示されます。すでに作成したアカウントでログインした状態になっています。
「今すぐ購入」をクリックし、あとは画面に従って操作していくとライセンスの購入ができます。

ライセンスの購入が完了すると、有料版として使用可能になります。

「VoxBox」の使い方
「VoxBox」の読み上げ機能について以下の2点を実際に行ってみます。
1)テキストの読み上げ(音声データへ変換)
2)PDFファイルの読み上げ(音声データへ変換)
本記事では、有料版を使って説明します。
無料版でも基本的には同じようにできますが、一部制限はあります。
1)テキストの読み上げ(音声データへ変換)
テキストデータを読み上げ(音声データへ変換)する方法を紹介します。
ソフトを起動し、左メニューの「テキスト読み上げ」をクリックします。

読み上げたいテキストを入力します。

読み上げる言語とボイスを選択するために、「ボイスチェンジ」をクリックします。

今回読み上げるのは日本語の文章なので、「日本語(日本)」を選択し、表示されたボイスの中から「Rika」を選択しました。決定する場合は、「使用」をクリックします。

ボイスが選択した「Rika」に変わっていることが確認できます。

特定の文章や単語に対して、音量や読み方を変えたり、強調したりといった調整も可能です。文章間の間を設定することもできます。
文章を選択して、右側にある「音量」や「ピッチ」などを設定することで可能です。
間を空けたい場所にカーソルを合わせて、右側の「一時停止」を設定することで、間を空けられます。

右下の「変換」をクリックすることで、音声への変換が実施されます。

変換が完了すると、変換後の音声が下に表示されます。
ここで変換後の音声の確認や削除、音声ファイルへの出力が可能ですが、ハサミマークをクリックすると編集画面に移動し、音声の編集も可能です。

編集画面では、音声のカットが可能です。
音声ファイルに出力する場合は、「出力」ボタンをクリックします。

出力する音声ファイルのファイル名や形式、出力先(保存先)を選択し、「確認」ボタンをクリックします。出力形式はMP3以外にもWAVやAACでの出力が可能です。

出力先に設定したフォルダに音声ファイルが出力されています。

これでテキストの読み上げ(音声ファイルへの出力)は完了です。
出力した音声はこのような感じになっています。(再生時は音量にご注意ください)
多少イントネーションが違う部分や間を空けたい部分については、細かく調整可能ですが、このままでも驚くほど自然な感じで読み上げられています。
2)PDFファイルの読み上げ(音声データへ変換)
PDFファイルに記載された文章を読み上げ(音声データへ変換)する方法を紹介します。
使用するPDFファイルは、先ほどと同じ文章をPDFにしたものです。

ソフトを起動し、左メニューの「PDF読み上げ」をクリックします。
画面右の「ファイルを追加」をクリックしてPDFファイルを選択します。

PDFファイルを選択すると、ソフトが自動的にPDFファイルの文字を解析し、テキストに変換します。

あとは、テキストの読み上げの時と同じで、ボイスを選択し、必要に応じてテキストのテキストの読み方を変えたり強調して、「変換」ボタンをクリックします。

変換が完了したら音声ファイルに出力して完了です。

出力した音声ファイルはこのような感じに出来上がっています。(再生時は音量にご注意ください)
先ほどと同様で、完成度が高いです。
まとめ
本記事では、テキストやPDF、画像など様々なデータの読み上げが可能な、iMyFoneのAIテキスト読み上げソフト「VoxBox」を紹介しました。
「VoxBox」は、テキストだけではなく、PDFファイルや文字の含まれた画像ファイルといった様々なデータを音声データに変換できるソフトウェアです。しかも操作は簡単です。
変換した音声データはかなり自然で、完成度が非常に高いです。
音声データに変換できることで、時間の有効活用にもつながります。
少しでも興味を持ってもらえたら、まずは無料版から試してみてください。

コメント
いわっちさん
読み上げツールを探していたタイミングで記事を読みました。
わかりやすくレビューされていてすごく参考になります。
ありがとうございます。
※いわっちさんのブログ、商品を探している人に役立つ素敵なブログですね。
ミハナさん、コメントありがとうございます。
参考になったとのことで、良かったです^^
また、お褒めのお言葉をいただき感無量です!!
これからも役立つ記事を公開していきますので、応援していただけると嬉しいです。
記事とても参考になりました!
私は永久ライセンスを購入して少し気になったのですが、右上に変換可能文字数が出ていますが、永久ライセンスの場合も同じで200万文字までとなっています。これを使い切った場合追加で文字数を購入しなければ利用できなくなるのでしょうか?それとも時間でリセットされるのでしょうか?
追加購入が必要な場合は永久ライセンスの意味が無い気がして気になりました。
長々すみません
はかどんさん、コメントありがとうございます。
永久ライセンスの場合、文字起こしの文字数は200万文字、文字起こしの時間は20時間まで使用できます。(時間でリセットはされないようです)
使い切った場合は、ソフト内で追加で購入することが可能です。
永久ライセンスであっても文字起こしに関してはこのような追加購入が必要となります。(もちろん無料ライセンスや年間ライセンスに比べると多い文字数と時間になっています)
※永久ライセンスであれば、全てにおいて制限なく使えると思ってしまいがちですが、以下のライセンス購入のページにあるように文字起こしに関してのみ制限があります。(AIを使ったソフトはこのようになっていることが多いです)