Vol.87

音声人工知能で世の中を変えていく

Hmcomm(エイチエムコム)株式会社
代表取締役CEO 三本 幸司 氏
寄稿者:尾崎由佳、河西あすか 
完全無人のチェックイン・アウトを実現、世界最先端のロボットがお客様をお出迎えする「変なホテル」。ここで利用されている音声認識システムを提供しているのが、今回ご紹介するHmcomm(エイチエムコム)株式会社です。

Hmcommは、音声認識技術を用いたシステム開発、ソリューション・サービスを行っています。近年発展著しいAI(人工知能)とディープラーニング技術の中で、音声認識は最も期待されている分野の一つです。
2016年3月からは、三菱東京UFJ銀行の法人向け業務の一部において、企業の業態・業務課題などに合わせてカスタマイズした音声認識システム「The VOICE BISINESS」が導入されています。

音声人工知能で世の中を便利で面白いものに変えていく、国立研究開発法人産業技術総合研究所発ベンチャー、同社CEO三本幸司氏に、今後の展開についてお話を伺いました。
代表取締役CEO
三本 幸司 氏
神奈川県横浜市出身。富士ソフト株式会社で技術畑一筋。ここで多種多様なソフトウェア開発の魅力にはまる。2012年に独立してHmcomm株式会社を創業。2014年に産総研発ベンチャー称号認定を受け、音声処理のディープラーニングの実用化及び人工知能との融合に挑む。
一般社団法人日本スマートフォンセキュリティ協会(JSSEC)理事
モバイルコンピューティング推進コンソーシアム(MCPC)顧問
Hmcomm(エイチエムコム)株式会社
http://hmcom.co.jp
設立
2012年7月24日
社員数
30名
《 Mission 》
キーボードレスの新しい社会を創造する
《 事業分野 》
AI
《 事業内容 》
国立研究開発法人産業技術総合研究所(以下、産総研)発のベンチャー企業として、産総研独自の音声処理技術を用いた要素技術の研究・開発、ソリューション・サービスの提供。
主な技術はディープラーニング音声認識処理、自然言語処理。
この企業の募集情報を見る

「手に職を」という父の助言からプログラミングの道へ

アマテラス:三本さんの生い立ちについて聞かせてください。

Hmcomm株式会社 三本CEO(以下、三本):
父親が自営業で、大森に工場があり、LEDやスイッチの製造下請けをしていました。母親もその組み立て作業を夜遅くまで手伝っているような、そういう環境で育ちました。

経営的、経済的に苦労している、などと聞いたことは一度もないのですが、「欲しいものを買って欲しい」と簡単に言えないような雰囲気は感じていました。

母親は「大学に行って、大企業に入って安定した仕事をしなさい」と常に言っていましたが、父親は「好きな事をすれば良い」と言っていました。ただ「これからはコンピュータ社会になるから、コンピュータの勉強をしてみたらどうか」とは言っていたような記憶があります。でも、心の底では自分の会社を継がせたい気持ちがあったと思います。

私は、母親をがっかりさせたくない思いから、「大きい会社(製造メーカー)に入らなくてはいけない」と考え、理系を選択して受験しましたが、全敗してしまいました。

そこで、「手に職を付けなさい」と父親に言われたこともあり、大学受験に再チャレンジすることなく、日本工学院専門学校(蒲田)に入学しました。
この学校は予想外にとても厳しく、勉強しない生徒は進級することができず、かなりの同級生が落第していきました。なので、遊びたい気持ちを抑え、一生懸命勉強しました。

『IT』という言葉がない時代からのスタート

三本:
ただ当時は、我々のようにきちんとプログラミングを習得した学生でも、銀行の電算センターで24時間交代勤務の磁気テープの交換役といった仕事がとても多く、実際にプログラミングする仕事は非常に少なかったのです。

しかし、幸運にも、日本工学院の教師が作った会社でソフトウェア開発を主体にしている会社(現在の富士ソフト)を紹介してもらい、入社することができました。
私の大きな転機はそこです。

アマテラス:富士ソフトがまだあまり知られていない頃の入社ですよね?

三本:
全く知られていません。『IT』という言葉もまだない時代でした。

日本工学院と富士ソフトは、この後の自分のスキルアップ、社会人としての人生で大きく影響を及ぼしていくことになります。

富士ソフトに入ってからは技術習得に相当苦労し、チームの仲間や先輩にいろいろとフォローしてもらいながら、人の倍の時間をかけて立ち上がっていきました。とても『優秀な社員』とは言えなかったと思います。

オフィスにてご自身のキャリアを語る三本氏

携帯電話市場の拡大と『富士ソフト』ブランドの確立

アマテラス:急成長する富士ソフト時代のエピソードを聞かせてください。

三本:
私が取締役になった背景には、携帯電話の発展が大きく影響しています。

1994年頃の携帯電話の自由化により、それまで電電公社から直接提供されていた携帯電話が、買取制となり、一般に普及して急激に市場が拡大しました。
通信キャリア5社に、端末電話メーカーが数十社ありましたので、単純計算で5キャリア×数十社×春/秋モデルで計100機種以上の携帯電話が開発され、販売されるようになっていったのです。各社で“小型化”と“新機能”を競い合い、1機種100億円程かけて開発していた時代です。
まさにガラパゴス携帯の誕生です。

新しい端末が企画される度にソフトウェア開発の需要が高くなり、富士ソフトはそういった仕事をどんどん取り込んでいったのです。開発を委託される立場でありながら、新しい技術を身に付け、その技術を横展開していく、という好循環を続けた結果、この分野では国内ナンバーワンになりました。

その後も爆発的なモバイルマーケットの拡大・成長が続く中で、技術部長となってからは“ヒト・モノ・カネ”をうまく回すことを身につけていきました。売上や利益が拡大する過程で、若い世代の課長や部長が育ち、私が押し出されて、たまたま取締役になりました。
これもまた、ガラパゴス携帯のおかげです。

しかし、会社や私に多大な影響を与えたガラパゴス携帯もグローバル化の波にのまれて終焉を迎えて行きます。私自身も社内で次の新事業創出にチャレンジして行きますが、結果を焦ってもがき苦しむことになります。

スピーディーな意思決定を求めて、富士ソフト退社

アマテラス:2012年に起業されますが、26年勤めた富士ソフトという上場企業の取締役をなぜ辞めたのでしょうか?

三本:
富士ソフトを辞める前の数年間、新規事業を任される機会がありました。
ベンチャーだと「アイデアがあっても資金がない」などと良く言いますが、大企業の場合、ヒト・モノ・カネが揃っていても意思決定のスピードがなく、事業がスムーズに立ち上がらないで頓挫するケースが少なくありません。投資の意思決定プロセスに専門性がなく時間ばかり経過してしまうことを何度も繰り返すと、「新しい事業を進めていくには規模が大きすぎる」と考えるようになり、「環境を変えて再チャレンジするしかない」と思い、半ば衝動的に飛び出してしまいました。

フィリピンで見つけたビジネスチャンス

三本:
起業して2年間は、それまでお付き合いのあった複数の企業のアドバイザー的ポジションで仕事をさせてもらいました。
そして、2014年に、富士ソフトのメンバーから声を掛けてもらい、たまたまフィリピン視察に付いて行く事にしました。半分は観光気分だったのですが。

アマテラス:フィリピンでは、何を視察されたのですか?

三本:
ビジネスの中心街、マカティ地区のコールセンターを視察しました。巨大な高層ビルの数十フロアの全てがコールセンターで、あるフロアでは数百人が、録音された会話内容を聞いて文字化をしていました。
フィリピンは、労働力が安いばかりか、訛りのない英語で、北米企業のコールセンター業務を大量にアウトソーシングされていたのです。

電話の会話内容の文字化は、音声ビッグデータの活用という点で魅力的な分野であると感じ、直感的に「日本でもやりたい」と思いました。
会話や電話の内容などをしっかりモニタリング出来るようになると、その内容を分析してマーケティングに利用するなど、ビジネスとして需要があると考えたのです。

例えば、音声認識技術を実用化すれば、コールセンターの効率化が可能になります。そして、次に、お客様との対話の中から様々なビジネスチャンスを導き出し、最終的にはコールセンターから営業部、マーケティング部に指令を出すといったコールセンターの組織的ポジションや役割そのものを進化させる具体的なイメージが徐々に浮かんできました。

産総研発ベンチャー企業の誕生

三本:
そして、国立研究開発法人産業技術総合研究所(旧通商産業省工業技術院の15 研究所と計量教習所が統合・再編された国立研究開発法人の一つ。以下、産総研)に行き、「産総研が持つ音声認識の技術を私に使わせて下さい」とお願いをしました。

すると、「数千万円」のライセンス費用が必要であることがわかり、落胆していたところ、「技術移転ベンチャー制度」というものを紹介頂きました。そして、紆余曲折がありましたが、結果的にこの制度の称号付与を受け、産総研の音声認識の権威である緒方さんと二人三脚で、スタートすることになります。緒方さんには、感謝に堪えません。

Hmcommサービス展開

自社開発の為の資金調達に苦心

アマテラス:起業して、どういう壁にぶつかりましたか?

三本:
最初は、音声認識エンジンだけをライセンスしようと思ったのです。しかし、コールセンターに「音声認識エンジンです」と持って行ってもコールセンターシステム用に仕立てないと、お客様には理解して頂けない。
つまり、お客様の課題を解決するソリューションに仕立てないと、実績のない我々は相手にされません。このことが、最初はわかりませんでした。

お客様からお金をいただいて行うシステム開発(受託)と、自分で先行投資をしてお客様に提供するシステム開発(自社開発)との大きな違いは資金です。
この後、金銭的にとても苦労していくことになります。会社の預金通帳の中身を見ることができないほどの相当なストレス状態で日々のた打ち回ることになります。

アマテラス:資金繰りは、どのようになさったのですか?

三本:
最初は日本政策公庫に1000万円の融資をしていただきました。
売上がある程度、計画的に上がっていくよう考えていても、なかなか筋書き通りには行かず、受注(契約)や開発に遅れが生じると、資金は底をついてしまいます。

そこで、VCに出資をお願いするために事業計画書を提出するのですが、「実績あるの?」、「もうちょっとだね、3ケ月後にまた」、「この段階だと投資委員会に出せない」等と言われてしまいました。
次に、都内の信用金庫をまわりましたが、ほとんど相手にしてもらえませんでした。

この後も苦しみ、不運と幸運を繰り返し、トータル幸運が少し上回り、現在も生き残っているといった感じでしょうか。

金融機関やロボット等で活用が進む音声認識システム

アマテラス:現在、Hmcomm社はどのようなサービスを提供しているのですか?

三本:
現在、大きく分けて3つのソリューション・サービスを提供しています。
まず、「VCRM」。これは金融機関の顧客管理向けのソリューションで、現在は銀行の法人営業部向けにサービスを提供しています。銀行における業務の効率化はもちろん、テキスト化したお客様の声から営業や業務の課題解決や提案といった顧客サービス向上をも考えて導入されています。

次に、「VContact」というコールセンター向けソリューション。
毎日お客様と膨大な会話が交わされるコールセンターですが、このソリューションを導入する事で会話をリアルタイムにテキスト化し、さらに会話内容を自動要約する事が出来ます。
効率化、省力化や迅速・適切なクレーム処理などに役立てるばかりでなく、集まった顧客の声からビジネスの課題を抽出し、営業や商品・サービス開発等に活かすマーケティングにも活用出来ます。

これらのソリューションはオンプレミス(企業等が情報システムの設備を自社で保有し、自社の設備において運用する事)、クラウドのどちらにも対応していますので、お客様のニーズ、セキュリティレベルに応じたサービスを提供する事が可能です。

そして、3番目は『変なホテル』に提供したロボット、IoT機器向けに機械の聴覚として「VRobot」です。複数のロボットメーカーや装置メーカーに提供しています。

この他、「音声認識+人力」で低価格・短納期・高品質を実現した文字起こしサービス「VCrowd」、動画や音声ファイルからの自動音声認識「VBox」など、弊社の最新技術をお気軽に試して頂けるサービスも提供しています。
これらのサービスを通じて、実音声データによる音声認識エンジンの強化学習を日々行っています。

「声」の次は「音」!音声認識技術がビジネスを変えていく

アマテラス:Hmcomm社が目指す未来について、教えて下さい。

三本:
私達の目指す音声認識の未来は、「キーボードレスな社会を作りたい」という事です。
今はコールセンターの効率化や自動化、無人化などをターゲットにしていますが、次は人ではなく、モノの音声認識を進めていきたいと考えています。

東京モーターショーでお見せしたのは、エンジンの異音を検知して故障を予知する、或いは、ブレーキや工場の装置の摩耗を音で検知して壊れる前に対処するなど、モノの音声認識機です。今後は、この分野の開発を進めていきます。

最終的には、人の心音や肺音、胎児の心音などの音もきちんと異常検知できるようにしたいです。聴診器から音を収集できるしくみを構築できれば、新たなソリューションの創出が可能となります。

アマテラス:最後に一言お願いします。

三本:
先端技術と既存技術を擦り合わせて、既存の伝統あるマーケットの常識を、我々の手でリプレイス(置換)を一つでもしてみたいと思います。それがベンチャーの強みでもあり、弊社の使命と言えます。

アマテラス:素敵なお話をありがとうございました。

寄稿者:尾崎由佳、河西あすか 
Hmcomm(エイチエムコム)株式会社
http://hmcom.co.jp
設立
2012年7月24日
社員数
30名
《 Mission 》
キーボードレスの新しい社会を創造する
《 事業分野 》
AI
《 事業内容 》
国立研究開発法人産業技術総合研究所(以下、産総研)発のベンチャー企業として、産総研独自の音声処理技術を用いた要素技術の研究・開発、ソリューション・サービスの提供。
主な技術はディープラーニング音声認識処理、自然言語処理。
この企業の募集情報を見る

RELATED POST