VOICE

VOICE.

VOICE.

VOICE

#データサイエンススクール 本講座

データサイエンティスト育成コース:鎌形 桂太 様

鎌形 桂太 様


Q、鎌形さんはどのようなお仕事をされているのでしょうか。

主務は特許部で、法律文章や技術文章を読み込んで、旧来技術との差異点を検討して自社にとって有用な特許を作りこむ業務を行っています。データミックスを受講したことで、経営管理・予算管理の仕事が多くなってきました。年間数十万件のレコードを用いて、現状のリソース配分を可視化したり、将来分の予測等をしています。
特許の取得や維持に年間数百億円規模の費用が生じるので、カテゴリーに分けて、どういった分野でどのような特許があって、来年はどの分野でどのくらいの費用が生じるかということを予測する業務を行っています。

Q、データサイエンティスト育成コースを受講されたのはどんな理由からだったのでしょうか?

背景としては、特許の分野にもAIやデータサイエンスの波が到来し、様々なベンダーが自然言語処理などを用いた特許分析システムを開発し、自社にも売り込みが来ることが多くなりました。 データミックスを受講しようと思った最初の目的は、これらのベンダーと技術的な面でも会話できればいいかな、という漠然としたものでした。
特許スコアといっても、出願されている特許の文章類似度を計ったり図るモデルやなど、引用被引用数によって重要度を計ったり、特許に関するモデルは様々に作られています。
実際に受講を終えてみて、ベンダーから提案されたモデルの評価について着眼点を持つことができているという点で、自分は成長できたと思います。

Q、なぜ、データミックスのスクール形式を選ばれたのですか?

社内講習もありましたが、某ベンダーが作った有料ソフトウェアを用いて、GUIで簡単な統計モデルを作ることを内容にしたようなもので、あまり実務的には使えない印象でした。
データミックスでは、モデルの背景にある統計等を初歩的なところから学べる点と、オープンソースであるPythonやRを用いて自らの手でモデルを構築する手法を実践できる点、に魅力を感じ、データサイエンティスト育成コースを受講したいと思いました。
加えて、データミックスの講師は、実務も行っているということでしたので、そのような方から直接お話を聞けるという期待もありました。

Q、6ヶ月を終えられて成果はいかがでしたか?最も手応えを得られたスキルはどの部分ですか?

ベンダーが提示してくる文書解析のスコアリング等の指標についても、その出し方がどうなっているのか等の視点をもてるようになりました。
テキストを分析するといっても、形態素解析して区切ったり、ステミングして正規化したり、各行程でチューニングが必要なので、そのような押さえるべきポイントをベンダーとディスカッションできるようになったことがよかったです。

Q、予習や復習はどのようにされましたか?

実務でプログラミング(主にエクセルのVBA)を使っていたので、コーディングについてはあまり問題なかったです。統計については、隙間時間で本を買って勉強をしていました。

Q、一緒に学んだクラスメイトとは、どんな交流をされたのですか?今も続いていますか?クラスメイトができることへの感想も聞かせてください

様々な曜日で受講していたので、クラスメイトと仲良くなる機会はあまりなかったです。深く話をする機会こそありませんでしたが、受講生ごとにバックグラウンドが異なり、年齢層も幅広く、同じ空間で授業を受けるだけでも刺激になりました。データミックスの卒業生グループのゼミに関しては、興味があり、今後参加していきたいと考えています。

Q、データミックスの6ヶ月講座を終えての感想を聞かせてください

講師に気軽に質問できる環境は良かったです。

また、データ分析という難しいことをやっているけど、あまり難しそうな感じを出さずに、楽しみましょうという雰囲気がスクールの講師全体で醸成されていたため、6か月間くじけずに取り組むことができました。

Q、これからの受講生にアドバイスをお願いします。

私は、AIってなんなのだろう?という興味から入って、受講を通じて、社内でAIやデータサイエンスをどのように活用できるか、というところに目が行くようになりました。また、既存データを集約化し、可視化するだけでも 大きな意味があると認識するようになりました。 例えばですが、部ごとに個別管理されているAccess/Excel/SQLに点在するデータを1つに集約して分析しようとした事があるのですが、フォーマットが統一になるように集約して可視化しただけも十分な示唆を得ることができてしまう場合もあります。既存データをどのように料理すればよいかを会得できたのは、受講前は 想定していない成果だったかと思います。
社内のデータを使って、「できること」や「できないこと」が区別できるようになるだけでも非常に価値のあることだと思っています。これからの受講生にとっても、そのような観点で受講することで、得られるものはたくさんあると思います。

VOICE一覧