dip Engineer Blog

Engineer Blog
ディップ株式会社のエンジニアによる技術ブログです。
弊社はバイトル・はたらこねっとなど様々なサービスを運営しています。

JSQPS 2024 Summer Meetingにて弊社のデータサイエンティストが発表しました

こんにちは!ディップ株式会社でデータサイエンティストをやっている久保です。2024年7月6日・7日に高知工科大学(高知県高知市)にて行われたJSQPS(計量・数量政治学会)に参加してきました。今回は、弊社のデータサイエンティストである呉東文(以下、呉)が自分の研究を発表しました。このブログでは、JSQPSについて簡単に説明したあと、学会に弊社データサイエンティストが参加する理由や呉の発表の様子をつづります。

JSQPSとは

JSQPSは計量的・数学的手法を用いた政治学とその関連領域での論文執筆・投稿を支援する学会です。参加者は、主に政治科学(ポリティカルサイエンス)を専攻する研究者と大学院生です。ここ数年は夏と冬の2回開催され、国内だけでなく海外からの参加者も多いです。

JSQPSに参加する理由

弊社は求人広告事業や人材紹介事業を展開する会社です。なぜそんな弊社のデータサイエンティストが、事業とは一見無関係に見える政治学の学会に参加するのでしょうか。その理由は主に2つあります。

[1]大学院時代の研究の延長として、研究成果を発表する機会となるから。

データサイエンティストと聞けば、機械学習や自然言語処理など自然科学出身の人がやるもの、というイメージがあるかもしれません。ですが、弊社のデータサイエンティストは政治学や経済学など、社会科学出身の人が多いです。

[2]政治学で用いられる手法が社内のデータ分析業務に活かせるから。

例えば、政治学で用いられる分析手法の1つに構造トピックモデルなどのテキスト分析があります。求人広告には時給や勤務条件などのテキスト情報が多分に含まれていることから、テキスト分析を通して得られる知見を営業活動に活かしてもらうといったことが可能になります。 

このように、弊社にはデータサイエンティストの業務に役立てられるならば、学会参加を通じた分析手法のブラッシュアップをいとわない文化があります。

発表内容

研究の詳細は呉のqiitaアカウントをご覧ください。ここでは内容をかいつまんでお伝えします。

今回の呉の発表の根幹は、以下の2つになります。

[1]技術的な観点から、既存の項目反応理論の改善を試みること

次元数は分析者が決めるため、恣意的になりかねません。項目反応理論では次元数として1がしばしば用いられますが、彼はディリクレ過程混合モデルを用いて次元数をノンパラメトリックに推定する手法を提案しました。

[2]議員のイデオロギーの観点から、所属政党を超えたイデオロギーのレジームを捉えること

先行研究は、アメリカの国会議員をめぐって彼ら・彼女らのイデオロギーが所属政党で説明できるかどうかを論じてきました(Poole and Rosenthal 1991, Poole, Rosenthal and Kenneth 1991など)。ディリクレ過程混合モデルを用いることで、所属政党以外に議員のイデオロギーを説明するものがあるのかどうかをノンパラメトリックに推定できます。分析には2005年から2006年のアメリカ上院における投票データが用いられています。

結果的に、呉は2つの次元(共和党と民主党)でアメリカ上院の投票データを説明できると述べました。ただし、すべての議員が所属政党のイデオロギーに従った行動を取っているわけではなく、民主党の一部の議員は共和党的な態度(小さな政府志向)を取ったり、その逆も然りといった結果が出ています。   上記の結果を踏まえ、呉は3つの課題を述べて発表を締めくくりました。1つ目は、用いられる次元数が経年的に変化する可能性があること。今回の分析では2年間の投票行動を分析対象として2つのクラスターが導かれましたが、より長い期間で見るとクラスター数が変化する可能性があります。2つ目は、法案のテキストをモデルに入れたほうが、結果の解釈性が高まること。最後に、無限次元のノンパラメトリックベイズがそもそも存在しうるのかということです。

発表後は質疑応答の時間です。まず、比較政治の研究者から「アメリカでは政党横断的に大きな政府と小さな政府を求める勢力が存在しており、無限次元からのクラスタリングでその存在を確かめるのはとても面白い」というコメントがありました。また、「クラスタリングの手法は他にもある。せっかく無限次元を利用するのであれば、二大政党制という(シンプルな)事例ではなく、錯綜した議会等に用いることで、その優位性が示すべきではないか。」という提案があり、それに付随する具体的なアイデアも飛び交っていました。さらに、「ハイパーパラメータの設定はどうなっているのか。パラメータの設定次第でクラスター数は大きく変わるので、気になる」といったコメントも。それぞれの質問・コメントに対し、呉は落ち着いて回答していました。

おわりに

学生時代は応用研究の論文を読むことがほとんどでしたが、本学会は手法に関する発表が多く、非常に刺激を受けました。実際に、いくつかの発表は業務に活かせるように思いました。筆者もいずれ学会で発表できるところまで成長したいという思いを胸に、高知をあとにしました。

参考文献

Poole, Keith T., and Howard Rosenthal. "Patterns of congressional voting." American journal of political science (1991): 228-278.

Poole, Keith T., Howard Rosenthal and Kenneth Koford. "On Dimensionalizing Roll Call Votes in the U.S. Congress" The American Political Science Review 85.3 (1991): 955-976.