ゼミ活動記録
2023/4/28 第3回 地価を可視化する
2023/5/12 第4回 新型コロナウイルス新規感染者数の推移を可視化する
今回のゼミ講義では、Processingを用いて新型コロナウイルス新規感染者数の推移を可視化するという課題に取り組んだ。
グラフは、凡例の通りに年齢別のデータを折れ線グラフで表示している。
2023/5/19 第5回 ノードとエッジからなるグラフを利用して可視化する
今回のゼミ講義では、Google Colaboratory上でPythonを用いて、ノードとエッジからなるグラフを作成するという課題に取り組んだ。
1つ目のグラフは、今年3月に世界一となった野球日本代表侍ジャパンに関して、インターネット上にいくつかある選手間の相関図を再現した。全選手が等しく報道されているとは言えないという前提はあるが、やはり大谷翔平へのPagerankが高いことが一目瞭然であった。
2つ目のグラフは、興味本位で2023年シーズンにおける読売ジャイアンツの投手継投(~5/21)をグラフ上に表現してみた。ノードの数字は投手の背番号である。このグラフのポイントは、同様の継投が複数試合で行われている場合があることと、Pagerankにおいて、投球イニング数は関係していないということであると考える。
2023/5/26 第6回 csvファイルから可視化する
今回のゼミ講義では、Google Colaboratory上でPythonを用いて、csvファイルのデータを折れ線グラフで可視化するという課題に取り組んだ。
このグラフは、読売・坂本勇人選手のプロ入りから昨季までの年度別安打数の推移を可視化したものである。
また凡例上の「安打」は、単打、二塁打、三塁打、本塁打の合計となっている。
ちなみに、2007年がプロ1年目19歳のシーズンであり、2022年がプロ16年目34歳のシーズンである。
2023/6/9 第8回 形態素解析を用いて可視化する
今回のゼミ講義では、Google Colaboratory上でPythonを用いて、文字列の形態素解析を行い可視化するという課題に取り組んだ。
形態素解析は、MeCabというライブラリーを利用して行い、ワードクラウドという方法で可視化した。
この2つの図は、日本プロ野球界歴代最強遊撃手との呼び声も高い松井稼頭央元選手(現西武監督、左図)と坂本勇人選手(右図)の可視化結果を比較したものである。可視化元となる文字列は、両選手のWikipediaの「経歴」を引用している。
結果として、「打」「戦」「安打」などといったほとんどの野球用語の出現度が同じくらい高く、評価が似ていると言えるが、野球選手の経歴に使われやすい単語とも言えるのではないかと考えた。「記録」という単語も同様に頻出であることから、2選手ともレジェンドであるということがここからも言えるであろう。加えて、ともに「3」という数字に縁があるということは興味深いと思った。
また、共通しない単語について見てみる。松井選手の図には「盗塁」という単語が大きく表示されている。これは、2人の成績を比較すると一番差が出る項目である。すなわち、彼のストロングポイントと言えるだろう。
一方、坂本選手の図には「代表」という単語が大きく表示されている。つまり、日本代表としての活動成績が評価されているということが分かる。
このような可視化方法を用いることで、人物の特徴などをつかむことが容易になるように感じられた。