ソースネクストは12月9日、AIボイスレコーダーの新モデル「AutoMemo(オートメモ) S」を発表した。価格は2万4800円(税込み、以下同)で、2022年1月21日に発売する。
ソースネクストの「AutoMemo(オートメモ) S」AutoMemo Sは、録音した内容を文字起こしできるボイスレコーダー。名刺サイズのコンパクトなボイスレコーダーで、録音した内容を自動でクラウドストレージに転送して、テキスト化までできるという手軽さが特徴となっている。
新モデルでは2.83型のディスプレイを搭載し、文字起こしした内容をレコーダー本体で確認できるようにした。録音データはスマートフォンアプリに同期されて、同じ操作感で確認できる。
かつてのiPod nanoをほうふつとさせるコンパクトなボディー。画面下にあるのはホイールではなくタッチ式のボタンで、録音状態を通知するインジケーターを兼ねている録音の操作はシンプルで、電源オン時なら本体の録音ボタンを押すだけで開始、終了できる。録音データの転送やテキスト化は、Wi-Fi接続時に自動で行われる。ディスプレイはタッチパネルになっており、スマホのアプリと同様の操作感で操作できる。
テキスト化は日本語の他、英語、中国語など計72言語に対応する。翻訳機能はなく、複数の言語が混ざった会話は1つの言語を選んでテキスト化することになる。
録音・再生の操作はオフライン環境でも行えるが、リアルタイムでのテキスト化はできない。録音終了後、Wi-Fiに接続すると録音の内容がクラウドサーバに転送されて、サーバ上でテキスト化の処理が実行される。
スマートフォンアプリと接続したところ録音データと文字起こしされた内容は、メールアドレスに自動で送信できる他、Google DriveやOneDrive、Dropboxといったクラウドストレージに自動保存することも可能。
Wi-FiはWi-Fi5(IEEE802.11a/b/g/n)をサポート。BluetoothはBluetooth 4.2に対応し、Bluetoothヘッドセットを接続できる。
本体には充電用のUSB Type-C端子の他、音声入力用の3.5mm3極マイクジャック、出力用の3.5mm4極マイクジャックをそれぞれ備える。スマートフォンアプリはiOS 13.0とAndroid 6.0以上に対応する。大きさは約92×54×12mm、重さは約88g。
有線イヤフォンと有線マイク用にそれぞれ3.5mmジャックを備えるCPUはARM Cortex A53クアッドコアを搭載し、メインメモリは1GB。ストレージは16GBを内蔵する。録音形式はFLACだが、テキスト化の際にmp3形式に変換される。録音データはクラウドストレージへ保存後適宜削除されるため、内蔵ストレージの残量を気にせず利用できる。バッテリー容量は1800mAhで、連続録音時間は約16時間。
AutoMemo Sと一般的なボイスレコーダーとの比較AutoMemo S本体での録音および再生は無料だが、テキスト化にはクラウドサービスを使用するため、テキスト化した録音時間に応じて料金がかかる。
標準プランの「ベーシックプラン」では毎月1時間までの録音を無料でテキスト化できる。月額980円の「プレミアムプラン」に加入すれば、毎月30時間までのテキスト化が可能となる。より長い時間の録音をテキスト化した場合、10時間単位で購入できる「10時間チャージ」(1480円)も用意される。AutoMemo Sの発売に合わせて、購入から3カ月間、プレミアムプランの利用料が無料となるキャンペーンが実施される。
なお、ディスプレイなしの従来製品「AutoMemo」も継続して販売される。オートメモシリーズでは日本語の音声認識エンジンを12月16日に更新し、会話などのシーンでの翻訳精度が向上するとしている。エンジンの更新は旧製品のAutoMemoにも適用される予定で、その際の製品アップデートなどは不要となっている。
ディスプレイなしの従来モデル「AutoMemo」も併売される翻訳ツール「ポケトーク」シリーズの新製品として「ポケトーク字幕」も発表された。Windows/Mac対応のソフトウェアで、2022年1月より順次発売予定。料金は月額1100円、年額1万3200円のサブスクリプションモデルを採用する。なお、2022年3月まで無料で提供される。
ポケトーク字幕は、Zoomなどのビデオ通話で使える翻訳ソフトウェア。翻訳した内容を字幕としてリアルタイム表示できるのが特徴。字幕機能はこれまで、ポケトーク本体のオプション機能として提供されていたが、単体のソフトウェアとして販売されることになった。
WindowsとMac向けのソフトウェア「ポケトーク字幕」スピーディーな翻訳を特徴としているポケトーク字幕の出力は、ビデオ会議ツール側からはビデオカメラとして認識される仕組みで、ZoomやGoogle トーク、Cisco Webexなど多数のビデオ会議システムで利用可能。
翻訳から字幕表示までの速度が1秒以下と、リアルタイムに近い翻訳速度によって、円滑な通話が可能としている。ただし、翻訳・字幕表示が可能なのは通話者本人が話した内容のみで、通話相手の会話を翻訳するためには、通話相手がポケトーク字幕を導入する必要がある。また、録音機能や翻訳ログを残す機能は備えていない。
「ポケトーク字幕」は現時点ではPCのみの対応となっており、スマートフォン版の開発について具体的な計画はないとしている。
ビデオ会議システムからはビデオカメラとして認識されるなぜ録音・翻訳専用機を作るのか?