比較レビュー:HiDock P1 vs iPhone vs Premiere Proで文字起こし対決。軍配は誰の手に?

HiDock P1_00

AIの活用が盛んに叫ばれている昨今、AIが組み込まれたことにより飛躍的に便利になった作業といえば、会議やインタビューの文字起こし、そして要約だろう。最近ではスマートフォンの録音ツールにも組み込まれており、筆者自身、iPhoneのボイスメモとその文字起こしには日々助けられている。ちょっとしたMTGなど、これまでメモで済ませていたシーンを録音に置き換えることが増えてきた印象だ。

とはいえ、現状精度はいまひとつで「あーこんなこと話してたな」という理解の助けにはなるものの、実際に記事や議事録にそのまま転記できるかといえば難しい。これは現在のAI文字起こしツール・デバイス全体の問題なのだろうか…?

というわけで今回は、Makuakeにてプロジェクト実施中のAIレコーダー「HiDock P1」をレンタルし、その文字起こし精度をチェック。さらに比較先として、筆者が普段から使用しているiPhoneと、インタビュー映像の編集に使うことが多いPremiere Proに搭載された文字起こしツールも使用し、三者の精度を比べてみよう。

製品概要

HiDock

ボイスレコーダー

HiDock P1


製品名:HiDock P1
応援購入価格:19,990円(税込)
プロジェクトページ:https://www.makuake.com/project/hidock_p1/

目次

ChatGPT連携で要約もできる!新時代のAIレコーダー「HiDock P1

比較の結果をお届けする前に、まずは今回使用した「HiDock P1」について紹介しておきたい。

本製品はHiDockというメーカーが手がけるボイスレコーダーで、前述の通り大きな特徴はAIを活用した文字起こし、そして要約が可能な点。本体にはマイクとストレージが内蔵されているため、マイクで録音したデータを保存し、PC経由で録音データをクラウド型ツールにアップロードすれば文字起こし・要約を実行してくれる。

HiDock P1_01
今回お借りしたAIレコーダー「HiDock P1」。今回は検証していないものの、Bluetoothイヤホン経由での録音にも対応しており、ZoomやTeamsなどオンラインで行う会議などにも使用可能だ。

本体サイズは38mm × 126mm × 15.8mm(W × D × H)と手のひらサイズで、重量も約72gと軽くポケットなどにも気軽に収納できるサイズ感。内蔵ストレージは64GBも用意されているため、データ量を気にせず録音できるだろう。Makuakeでの応援購入価格は19,990円(税込)とそれなりに高価ではあるものの、録音・文字起こし・AI要約などの基本機能はすべて追加料金無しで使用できるのもポイントだ。

HiDock P1_02

HiDock P1・iPhone・Premiere Proで文字起こし精度を比較

ではここから比較に移っていこう。今回各デバイス・アプリを比較すにあたっての条件は下記の通り。

HiDock P1・iPhone・Premiere Proの比較条件

比較するにあたってのシーン設定として、今回はonesuite編集部で発生することの多いインタビューを想定。また記事に文字起こしの結果を掲載するため、社内でテスト用のインタビューを実施し原稿はChatGPTに考えてもらった。ちなみに原稿をそのまま読み上げると、発音やイントネーションがはっきりしすぎて実際のインタビューからは遠ざかってしまうため、協力してくれた二人にはあくまでも原稿を参考にしつつ、なるべく自然なトーンで話してもらっている。

HiDock P1_03
実際に録音を行った際の様子。

環境としては空調の効いた空間内で、比較的近距離に座り録音を実施している。録音にはHiDock P1とiPhone 16を使用し、iPhoneでの録音には内蔵アプリであるボイスメモを選択した。加えてAdobe Premiere Proの文字起こしをする際には、iPhoneでの録音データをそのまま使用している。ちなみにPremiere Proバージョンは25.3だ。

マイクとの距離は下記の写真を参考にしてもらいたい。

HiDock P1_04
こちらも実際に録音した際の配置。両側の人物との距離はそれぞれ約60cmほどで、近めの距離感だ。

音に忠実なHiDock P1、安定感のPremiere Pro、iPhoneは今ひとつ

さっそく結論を出してしまうが、この中で精度のみに注目するのであれば、もっとも高精度だったのはPremiere Proによる文字起こしだった。下記の結果を見てほしい。

原稿

本日はお忙しい中、誠にありがとうございます。ウェブメディア『未来の働き方マガジン』です。本日は、社長のリーダーシップのもと、先進的な働き方を実現されている企業のトップとして、その経営哲学とリモートワークの実際についてお話を伺いたいと思います。

iPhone

本日はお忙しいがりありがとうございます。ウェブメディア未来の働き方マガジンです。 #じゃ本日は #あの社長のリーダーシップの下と先進的な働き方を実現されている企業のトップにお話を伺いたいなと思ってまして、内容としては。 #えっと、軽哲学とリモートワークの実際についてお話を伺いたいと思っております。

HiDock P1

本日はお忙しい中、誠にありがとうございます。Webメディア、未来の働き方マガジンです。本日は社長のリーダーシップのもと先進的な働き方を実現されている企業のトップにお話を伺いたいなと思ってまして内容としては経営哲学とリモートワークの実際についてお話を伺いたいと思っております

Premiere Pro

本日はお忙しい中、誠にありがとうございます。ウェブメディア未来の働き方マガジンです。本日は、社長のリーダーシップのもと、先進的な働き方を実現されている企業のトップにお話を伺いたいなと思っていまして、内容としては経営哲学とリモートワークの実際についてお話を伺いたいと思っております。

上記はインタビューの台本と、それぞれの文字起こし結果をそのまま転記したものだ。前述したように原稿をそのまま読んでいるわけではないので、微妙にテキストが異なっているものの、HiDock P1およびPremiere Proの結果が際立って良いことがわかる。その中でもHiDock P1では後半句読点が消えてしまっているのに対し、Premiere Proではそちらについても問題なく記載されていた。

またHiDock P1およびPremiere Proの両者に共通する特徴として、「えっと」や「あの」といったフィラーが自動的に削除されている点もポイントの一つ。こうしたフィラーは聞いている分には概ね問題ないものの、文として起こした際にはかなり悪目立ちしやすい。こうしたところを自動的にカットしてくれるのは、文字起こしとしては大きな優位点といえる。

反対に大きく水を開けられてしまったのがiPhoneで、他2つと比べそもそも日本語として成立していないシーンも多い。例えば「本日はお忙しいがりありがとうございます」など発言内容が一部欠損してしまっている箇所や、それを補完するためか「軽哲学」といった、存在しない単語が生まれてしまっている。ここだけ見ても筆者が記事冒頭で記載した”実用レベルではない”という表現に納得いただけるかと思う。

次の例を見てみよう。

原稿

早速ですが、御社が全社的にリモートワークへ移行するという大きな経営判断を下されたのは、いつ頃でしょうか?

はい。我々が経営判断としてリモートワークへの本格移行に踏み切ったのは、およそ3年前、2021年のことです。

iPhone

じゃ早速ですが、まず 1個目 #えっと御社が前者的にリモートワークへ移行するっていう #、まあ、大きな #あの経判断だったかなと思うんですけれども、その判断をされたのは、いつ頃でしょうか ?そうですね。 #えっとリモートワークへの本格以降に踏み切ったのは。 #ええ、今からだいたい 3年前の 2000二十 1年のことです。

HiDock P1

早速ですが、まず1個目。

御社が全社的にリモートワークへ移行するという大きな経営判断だったかなと思うんですけれども、その判断をされたのはいつ頃でしょうか?そうですねリモートワークへの本格移行に踏み切ったのは今からだいたい3年前の2021年のことです、

Premiere Pro

早速ですが、まず1個目、御社が全社的にリモートワークへ移行するという大きな経営判断だったかなと思うのですけれども、その判断をされたのはいつ頃でしょうか。

そうですね。リモートワークへの本格移行に踏み切ったのが、今からだいたい3年前の2021年のことです。

iPhoneの精度が低いことは既にわかっているのであえて触れないが、ここでも一つ目の例とほぼ同様の結果だ。とはいえHiDock P1とPremiere Proとで、両者の間に微妙な差が現れている。例えば「まず1個目。」「まず1個目、」や「いつ頃でしょうか?」「いつ頃でしょうか。」といった句読点の判断だ。

句読点については端的にどちらが良い悪いを判断しにくい部分ではあるものの、どうやらそれぞれ文字起こしをする際の”クセ”のようなものがある。おそらくだがHiDock P1の場合は会話中の間の取り方やイントネーションから句読点を決定しているのに対し、Premiere Proでは文全体を起こしてから、文脈的に句読点を割り振っているのだろう。

Premiere Proがこうした補完を行なっていることの裏付けとしては、「本格移行に踏み切ったのは」の箇所がわかりやすい。原稿・iPhone・HiDock P1が全て接続詞を「は」で起こしているのに対し、Premiere Proでは「本格移行に踏み切ったのが」と唯一接続詞が変わっている。非常に細かい部分だが、発話内容に忠実に思えて、その実はかなり文章を”作っている”部分もあるようだ。そうした意味では、句読点の決め方を含めより音に忠実なのはHiDock P1と言えるかもしれない。

HiDock P1が真に威力を発揮するのは会議シーン

文字起こし精度の比較からは少し話がズレてしまうが、HiDock P1には「文字起こしとセットで要約が行える」という大きなメリットがあることについて触れておきたい。

この要約機能はHiDock P1から音声データを取り込む際に選択可能で、文字起こしのみに加えて要約をセットで行うかを選べる仕組み。時間としてもそうかからず、10分程度の音声に対して10数秒と非常に高速だ。

そしてこの要約、要約というよりも議事録を出力してくれるのである。

HiDock P1_05

画像を見てもらうとわかるとおり、録音を行なった際の日時場所を始め、発話内容から現場にいた出席者なども拾ってくれる。そして実際に行われた会話内容の要点をまとめ、議題ごとの整理次回以降のアクションなども出力してくれるという便利仕様。これなら会議中は話すことに集中し、メモは全てHiDock P1に任せるという運用もできるはずだ。

HiDock P1_06
話の全体概要と、その後必要なアクションをまとめたToDoリストまで用意してくれる。

参考までに筆者がインタビュー中にとったメモも掲載しておくが、情報の粒度としては雲泥の差。前項の文字起こし精度も十分なものだったが、HiDock P1が真に威力を発揮するのは会議シーンと考えてまず間違いないだろう。

HiDock P1_08
筆者がインタビュー中にとったメモ。インタビュー向けのメモのため議事録とは多少テイストが異なるものの、情報量の差は明白だ。

総合性能はHiDock P1がベスト。Premiere Proは用途次第

今回のテストを通して見えてきたのは、HiDock P1の総合的なコストパフォーマンスの高さだ。19,990円(税込 / Makuake応援購入価格)という価格設定ながら、基本的な昨日は全て無料で使えることに加え、操作方法も非常にシンプル。金銭的なコストや運用コストを含めても、この性能なら十分に価格以上の価値があると言える。

もちろんテスト結果だけ見ればPremiere Proも優秀なのだが、如何せん価格が高く、文字起こしのためだけに導入するのはオススメできない。こちらについては、我々のように映像編集もセットで行う場合の機能と考えて良い。またHiDock P1ならインタビュー以外の日常業務でも利便性を発揮してくれるため、多くの方にとってはこちらがオススメだ。

月並みな感想だが、専用デバイスはやっぱり凄い。これまでスマートフォンで文字起こしをしていた方や、一般的なボイスレコーダーを使っていた方。それHiDock P1ならもっと便利になりますよ?

HiDock P1_07

ギャラリー

HiDock

ボイスレコーダー

HiDock P1


よかったらシェアしてね!
  • URLをコピーしました!
目次