弊社はラーニング・アナリティクス(LA)の分析プラットフォームAnalytics+や学習履歴を蓄積するLRS=Mananda、各種分析業務など、ラーニング・アナリティクスに関する様々な取り組みを行っております。
そういうわけでラーニングアナリティクスを研究なさる先生方との交流も盛んで、多くの先生方に様々にご指導いただいたり最新の情報をご教示いただいたりしております。
そんな中、3月22日にラーニングアナリティクスに関するシンポジウムが京都大学で開催されるというので京都大学の緒方広明先生に招待いただき、シンポジウムに登壇させていただく機会を得ました。さらにその前日の3月21日に早稲田大学の松居辰則先生からも京都大学で開催される別の会の登壇の機会を頂戴しました。思いがけず、春の京都訪問になりました。
?21日のイベントはJSiSEをはじめとする様々な学会共同の研究会で、松居先生が主催するイベントでした。
上智大学の田村恭久先生、京大の緒方先生の他、京都外語大学の村上正行先生、大阪府立大学の黄瀬浩一先生、 奈良先端科学技術大学院大学の荒牧英治先生が登壇され、それぞれの立ち位置から取り組まれているLAの活動や、医療系という教育ではない他分野で行われているデータ分析の事例などを紹介いただきました。
(ちなみに、私がAnalytics+を作るときに一番参考にしたのは医療系の事例でした。あちらはデータ分析がおっそろしく進んでますので)
22日の「ラーニングアナリティクスに関するシンポジウム」では国内外の著名な方々が登壇されました。こちらは京都大学の緒方先生が主催なさったシンポジウムです。
緒方先生の講演を皮切りに、コロラド大学のGerhard Fischer先生、Data Insights Laboratories / EPFLのRakesh Agrawal先生、台湾の国立中央大学のStephen Yang先生、国立台湾科技大学のGwo-Jen Hwang先生、京都大学の美濃導彦先生が基調講演に登壇されました。
その後、研究事例の紹介として、 早稲田の松居先生、九州大学の島田 敬士先生、九州大学の山田政寛先生、京都大学の西岡 千文先生、京都大学のブレンダン・フラナガン先生、そして私、デジタル・ナレッジの吉田が企業側としての立ち位置で発表しました。
最後はパネルディスカッションで、基調講演者に加えて国立台湾大学のHsiu-Ping Yueh先生、九州大学の木實 新一先生が加わり、進行しました。
両日ともに、登壇されている方々を見ると、身震いするほどの大物ぞろいでして・・・ 私は末席で産業界から見た実際にLAを提供する立ち位置から見たLAの話をしておりました。
個別の感想というより、2つのシンポジウムを通したざっくりとした印象、講演内容にインスパイヤされて個人的に感じたことなどを書き留めておきます。
(1)LAの分析手法は次の次元に? ディープラーニングの適用
ラーニングアナリティクスは、データを集めて、それを集計したり分析したりして、何か有益な情報を見出す活動です。この「集計したり分析したり」というのが大きなポイントになります。
例えば、ランキング表示したり平均点・偏差値・問題別正答率を出したりするといった基礎的な集計に始まり、Excelでよく行われるクロス集計までは多くの方がイメージしやすい集計手法ではないでしょうか。これらは基本的ながらパワフルです。
やや応用としては下記のようなものがあります。
- 回帰分析(実測のデータをもとに、それらを説明できる関数を推定する。代表的なものは線形回帰で、y=ax+bという一次式で表現されます。気温が1度上がるとビールの出荷が何ケース増えるというようなものですね。相関係数という-1?1の数値で相関を表現する手法もあります←これ、すごく強力です)
- アソシエーション分析(有名な逸話として、あるスーパーでおむつを買った人はビールを買う傾向があるという傾向をはじき出した分析手法。ちなみにどうしてそうなるかというと、おむつはかさばるので、奥さんがご主人に買ってくるようにお願いをし、ご主人はスーパーおむつを買うついでに自分の買い物=ビールを買って帰るという寸法。アソシエーション分析としてはAprioriというアルゴリズムが有名)
ちなみに今回の登壇者の一人、Rakesh Agrawalさんは、このAprioriのアルゴリズムの発明者です。そんな高名な方とお近づきになれたのは個人的に大興奮でした。詳しくはこちらを。 - 決定木分析(ある結論(目的変数)に到るまでの過程を様々な変数(説明変数)を用いてどういう過程を経るのかを表現したもの。例えば成績優秀者がどのような行動を経たのかを見たりするのに使えます)
- クラスター分析(様々な要素のデータを共通項のあるグループに分類するのに使われます。学習者の受講パターンを洗い出したりするのに使えます。k-meansというアルゴリズムが代表的です)
ラーニングデータサイエンティストたちはこれら集計・分析を用いて、教育ビッグデータを紐解き、価値のある情報を引き出すのです。
ところが、昨今流行りのAI=ニューラルネットワークを用いると、こういう従来の分析を一つ一つやっていくのではなく、単純にデータと導き出したい結論をTensorFlowなどのニューラルネットワークに渡してあげて学習させるだけで、それなりのモデルがいとも簡単に作れちゃうのです。今回の一連の発表の中でもニューラルネットワークを用いた研究成果がいくつも発表されてました。ラーニングアナリティクスの分析にもこれからニューラルネットワークが増えてくる気配があります。
特に近年、取り扱うデータが構造化データだけでなく、画像や音声、動画、バイオデータなどの非構造化データも多くなってきており、そういうデータを処理しようとすると、ニューラルネットワークを使うと楽、というのも背景にはあるように思います。
一方、ニューラルネットワークは処理がブラックボックス化されており、どうしてその結論になるのかが見えづらいという弱点もあります。「どうしてそういう結論に至ったの?」という問いかけに自然言語でうまく説明しづらいという問題点もあります。「だって、AIがそう言ってるんだもん」では説明になりません。これはその推論が正しいかどうかを考える上での説明しづらさだけでなく、推論の結果を受けて、業務や教育の改善を行う際に、原因が説明しづらいのでどのように改善すればいいのか分かりづらいということでもあります。
ただこの問題は、発展途上の現時点での問題とも思え、実際に運用すると大した問題でなかったり、先々、技術の発達や新たなメソッドの誕生により解決される可能性も大いにあります。
というわけで、ニューラルネットワーク系の分析も今後大いに発展することを期待しますし、むしろこちらがデファクトスタンダードになるかもしれません。
(ただ、ニューラルネットワークを利用した解析は車の運転でいう自動運転車であり、MTはおろかATさえ運転したことない人に車の運転を語れるのか? ということも同時に思います)
(2)データの倫理
二日間双方のシンポジウムで、データの倫理や個人情報の件についての話が取り上げられてました。これはラーニングアナリティクスだけでなくSNSやWebサイトなどITテクノロジ全般における問題になっていることではあります。その中でもとりわけ教育ビッグデータには機微な個人情報が多く含まれます。これが適切に管理され運用される必要があります。個人が学習サービスを利用するにあたって個人情報の利用許諾を経由する必要があるでしょう。さらに分析する研究者にも倫理が問われ、シンポジウムの中では大学や学会で倫理規定を定め倫理委員会を設置することが提言されていました。
ちなみに、弊社もお客様からデータ分析を依頼される際には、個人情報を削除した情報をいただくことを徹底しています。出てきた結果もクラスターごとに説明したり集計情報や傾向を示したりするのみで、個人にフォーカスしたアウトプットを出さないようにしています。弊社の活動でいうと、学習履歴活用推進機構を立ち上げ、ここで「学習履歴の利活用に関するガイドライン」を策定して無償で公開したりしています。
さらにもう一歩踏み込んだ倫理観でいうと、例えば大学に入学した学生のデータ分析をしてある学生の退学率が90%という分析結果が出たとして、その学生にどう接する? という問題もあるように思います。私はラーニングアナリティクスの予知は映画『マイノリティ・レポート』に相通じるものがあると常々思っております。そしてその倫理観をこの映画では主要テーマとしております。この倫理観もそうなのですが、データサイエンス(映画の場合はメカニズムはやや異なりますけど)を駆使した近未来感が実に興味深いでのです。データサイエンスを行う方にはぜひ観ていただきたい! と思っております。ええ。
(3)大学におけるLAは(現時点では)限定的
今回は私以外、みなさん大学などの学術的研究を行われている立ち位置の方々でした。となるとLAの対象は自学への導入や、研究室レベルで行う先行的な実証実験というものが多い印象がありました。その中でもLAを受講者ではなく教師の役に立てようという流れが主流なようにも感じました。LA for Teacherなのか、LA for Studentなのか・・・ この辺りは我々企業とはスタンスが大きく異なるように思います。
自学の教育の質を高めるためにLAを導入することは非常に有意義ですし、先進的な研究を行うことで切り拓く技術領域があるのも確かです。ただ、一方で、私のような産業界で実際にお金をいただいてLAをやっている身からすると、それ以外の世界があるのになぁと思ったりもします。例えば企業研修において企業が研修の効率を高めたり個人のパフォーマンスを高める施策をLAが導き出せるとするなら、企業は積極的にLAを導入することでしょう。また、教育産業においてもLAは関心が高く、これまでの勘や経験だけでなくデータ・ドリブンな確証を持った指導を行ったり、真の意味で一人一人の学習に寄り添った個別指導をアダプティブに提供することだって可能だと思います。産業界はこういうニーズがあるものの、このニーズが直接的には学に届いていないという印象があります。
もちろん中には産学連携で共同研究をしている事例もいくつもあり先進的に取り組みもあります。特に塾や教育企業の中には大学と組んで効率的な学習メソッドの研究開発をしているケースがあり実装されるケースもあります。しかしまだまだ局所的ですし企業内研修へのフィードバックがなされていなかったり、大学で研究するLAの主要テーマにまでは行き着いていない感があります。
この産と学の間の壁を超えたり、産学連携してLAの価値を引き出し、方法、価値、事例など、それを広める活動を行うことが必要に感じました。もっと企業は大学に頼ってもいいように思います。
(4)まだバズってない?
先生方からは「まだラーニングアナリティクスって有効な事例も少なく、普及していない」という印象のお話が数多くありました。確かに私の実感からしても「まだアーリーアダプターが反応しているだけで普及期には入っていない」という感じがします。
とは言っても手応えはあります。LAに全く無関心なお客様はそうそうおられず、提供価値がわかりにくかったり、費用対効果が読みづらいがために、費用対効果が読めず、導入に踏み切れていない方が多いように思います。本来、eラーニングというのはコンテンツが電子化されてわかりやすく、いつでもどこでも学習できるだけでなく、学習履歴を活用してより効率的な学びに導入できるものであるはずで、LAの登場により後半の「効率的な学びへの導入」がより行いやすい環境が整ったのだと思います。
これからの時代は、わざわざLA=ラーニングアナリティクスと喧伝しなくとも、ごく普通に入り込むテクノロジ、例えばかつてのWebやデータベース技術や映像配信技術がそうであったように、になるのではないかと思っております。
以上、個人的に2日間のシンポジウムを通して感じたことを書きましたが、色々な気づきやLAの可能性を感じた有意義な時間でした。機会をいただいた京都大学の緒方先生、早稲田の松居先生に感謝です。
ここからは個人的な感慨のようなものですが、実は私は現役時代に京都大学理学部を受験しました。小学生の頃から京都大学に行くのが夢の一つで、そこから研究者になろうと夢見ていたのです(研究者の最高名誉であるノーベル賞といえば東大ではなく京都大学でした。今もその傾向はありますけど) 。結局受験ではボロボロで「来なくていいよ」とお断りされたのですが、かつての10代の頃、憧れた京都大学の、それもシンボルである百周年時計台記念館で登壇できるとは感慨深いものがありました。
もう一つ、今回お誘いいただいた先生の一人、松居さんは私の大学の研究室、寺田研究室の先輩でして、四半世紀前に私の卒業研究を指導いただいていた方です。いわば兄弟子にあたる方ですが、私のような落ちこぼれの学生とは違い、松居さんは優秀な研究者でした。私は当時eラーニングの前身であるCAIの研究をしてはいましたが、その道に進むとは思ってもいなかったのです。当時の模様はこちらをご覧いただくとして、そんな松居さんと同じ壇上に立つというのも、ご縁を感じますし、しみじみしたりします。
そういうわけで、実り多い春の京都2日間の旅でした。
【参考】