これはベイズ塾 Advent Calendar 2020の6日目の記事です。
というわけで、久しぶりに記事をポストします。

塾内はアカデミア関係者が多いですが、私は少数派の企業勤めのデータサイエンティスト兼マネージャーをやってます。ベイズ塾には初期から参加してて、もう若いメンバーをあたたかく見守るポジションになってます。主にRや技術的なサポートをしたり、データサイエンティストのキャリアとかについて紹介とか説明とかしてたりしてます。

さて本題です。

このアドベントカレンダーは「ベイズ塾にいる人ってどんな人なの?」という問いに答えるような、そんなものを提供することが目的の一つになっていると(少なくとも私は)思うので、私のことを書こうとは思うのですが…どうも自己紹介というものが対面でも文面でも苦手です。
でも苦手だから避けてると先に進まないので、タイトルのようなテーマで少し自分語りをしてみようかと思った次第です。

お話その1: Webサイト
大学に入学すると情報系科目が受講できるようになったのですが、当時所属大学ではPCの台数や情報教室の施設などの都合で、実際にPCに触れる演習は抽選制となっていました。私はもちろん実際に触りたかったのでエントリーしましたが落選。友人が「今日はメール使ったぜ」とか「ホームページ作った」とか楽しそうに会話しているのを横目に座学でした。
さすがにこのままでは悔しい、ということで時間割の隙間や講義終了後に図書館内の情報教室に行き、本棚にあるPC系の書籍を読みながらメールやWebサイトを作っていきました。
やがて当時演習を受けていた友人の多くは更新しなくなりましたが、私はその後も自分なりに更新を続けていきました。
このあたりの経験が、今の自分に影響してきたなぁと最近では感じます。

お話その2: 院生の交流イベント
院生時代、とある冬のイベントで他の大学院メンバーと学会以外で交流する機会があったのですが、そのときにとある方から「院生だけで集まって気兼ねなく研究のことを議論できたら楽しいよね」と提案がありました。当時はSNSなどなく、地方の大学では他大学の同世代のメンバーと交流するというのがなかなかに難しく、ぜひやりたいと私も賛同しました。そして他のメンバーも賛同し、「学会前日に院生だけで集まって発表・議論する」会がスタートしました。
初回に主要メンバー的なボジションで参加し、その次からは数回幹事として発表したり会の調整をしたりしてました。この会は非常に刺激的であり、当時はSNSなどなかった時代なので貴重な交流の機会となりました。
やがて私は就職したので幹事を引き継いだのですが、今もその会は続いているみたいでやっぱり嬉しいです。

お話その3: Hijiyama.R
その2から一気に時間が進みますが、決して何も作らなかったわけではなく紹介しづらいだけです、はい。
Rに触れるようになり、なんか面白いなって思い始めてきた頃です。広島にもHiRoshima.Rがあったのですが、幹事の方が忙しくてしばらく開催されていませんでした。そこで「もう自分で立ち上げてしまおう」と考え、このベイズ塾のメンバーやRに興味がある近隣の人に声をかけて「Hijiyama.R」を開催しました。
やはり自分で開催するとかなりのモチベーションになり、半年に1回、いろんなネタを生み出しては公開していきました。ベイズ塾のメンバーも、このHijiyama.Rにとっておきのネタをぶつけてきたりして、非常に楽しかったです。

お話その4: tubeplayR
これは「あったらいいなぁ」という思いはあったけど、どうしたらいいかわからなかったんです。そんな中、突然アイデアが浮かんできて速攻で作りました。試行錯誤の流れは以下を参照してください:
RStudioでYouTubeを流してみる
ネタのインパクトが抜群だったで、ほぼ私の代名詞的になってますね。仕組みが分かればコードも短いし簡単そうに見えるのですが、当時これを作れる人はそんなにいなかったんじゃないかなぁ…。
なお、ここで秘めていた思いは、以下のスライドの最後の方にあります:
目指せyoutubeRの星

お話その5: Rをベースにした自動分析レポートシステム
データサイエンティストとして分析業務をこなすようになったのですが、「Rでレポーティングを自動化するようなの、作りたいなぁ」と考えてました。てことで、作ってきたのがこのあたりです:
- 週次KPIレポートをconfluenceへUpするためにやったこと
- R, Git, Droneを使ってconfluenceへのKPI予測レポートを自動化した話
社内でもこういうのは今までなかったので、そういう意味ではタイトルの通り「ないから作った」ですね、はい。

……とまあ、昔話からやや最近の話まで5つほど持ってきました。
昔ほどの勢いはないかもしれないけど、自分の根底的にはやっぱり何かを作っていたい気持ちがあります。なのでこれからも自分のニーズや興味に忠実に、いろいろ作っていきたいと思います。これからもよろしくお願いします。

Enjoy!


ここ数年大晦日に振り返り記事を書いてきてたので、今年もなんか書いてみようかと思いました。

年初になんとなくは目標を立てていたんですが、いろいろあってもう忘れてしまいました。立てた目標は胸に秘めるのではなく記さないといけないですね。
てことでトピック箇条書きみたいな感じで。

Data Scientistのマネージャーになった

嘘みたいな話でしたが、マネージャーになりました。そしてまだマネージャーを続けさせてもらってます。現在はマネージャーとプレイヤーを兼務している感じで、普通に分析タスクもやってます。

自分がうまくやれているかどうかは正直確信は持ててないです。でも楽しくやってますんでそれはいいのかなって思ってます。もっとEnjoyを追求していきます。

書籍が出版された

今年の12月に、私も一部翻訳を担当した「Rではじめるソーシャルメディア分析−Twitterからニュースサイトまで−」が出版されました
https://www.kyoritsu-pub.co.jp/bookdetail/9784320124523

この書籍はぜひ分析を業務とする仕事を目指している学生などに手に撮ってもらいたいなと思っています。実際にコードを書きながら、さらに自分なりにアレンジしてより深くへとdiveしてほしいです。

個人的には、私が尊敬するRおじさんたちと一緒にできたことがうれしかったです。ありがとうございました。

なんどか登壇した

社内のいろんな会だったり、社外でのプレゼン機会などで発表してきました。でも実のところ何本喋ったか思い出せないです…でも個人的に一番気に入っているのは、実はこれだったりします:

R関連のプレゼンが落ちてきていますが、その分社内で諸々プレゼンする機会が増えているので、自分の中ではこんなもんかなとは思います。来年もぼちぼちやっていきます。

家族旅行してきた

春休みには上の子と青春18切符の旅を、GWには家族で神戸大阪京都の旅を、秋にはハウステンボスに行きました。

こんな感じで家族で楽しむ時間を確保できるようになったのはなによりで、今後も時間を作っていろいろ遊びに行くつもりです。なお上の子は次の春休みにも青春18切符の旅を計画しているようです。撮り鉄だけでなく乗り鉄への道も順調に進んでいてお父さん嬉しいです。

書き出してみると、こんな感じになるのかな?

なんかありきたりな内容ですが、日々楽しんでます。来年もまたいろんなことが起こると思いますが、懲りずにEnjoyへの最適化を意識して日々暮らしていこうと思います。今年もお疲れ様でした。


夏休みだし、思い立ったので、徒然と。

Managerになって数カ月経過。
当初は業務内容が一変して戸惑ったり色々思うことがあったりしたけれど、周りからのあたたかいサポートにより少しずつManagerとして前へ進めているのかなと、個人的には感じてる。
でも課題はまだまだあるし、Managerとしてやっていきたいことはたくさんある。今まで以上にバランス感覚を磨きながらいきたい。

自宅でPCを開く時間が極端に少なくなった。
これは仕事を持ち帰らないというMyルールと、休日はできるだけ家族と過ごすというかねてからの目標を達成するためではある。休日は家で家事したり料理したり、あるいは子供二人と三人でいろいろ出かけたりしてる。これが実に楽しい。
子どもたちを連れ回してあちこちのイベントに参加しては写真に撮って残していく。父親業を満喫してる。

「自分に向いていること」について考える時間が増えた。
これまで私は「データをゴリゴリ回して分析したりコードをひたすら書いていく」ことが自分に向いていると思っていた。でもそうではないらしい。
自分の評価と他者の評価が異なるのは当たり前だし、それは外のニーズにも依存するものだと思う。そう考えると、自分を置いている環境こそが良くも悪くも評価軸を規定するものであって、その意味でも自分をいろんな環境に放り込ませていくのは大事なのかなと思う。
でも本質的に私はEnjoy driven、Enjoyへの最適化しかできない人間なので、どこかに収束していくんだろうなっておぼろげに考えたりしてる。

「Rおじさん」から「R使ってるおじさん」になってきてしまった。
日本のRユーザーのレベルがこの2,3年めちゃくちゃ上がってて、特に若手の変態度(賞賛の意)がすごい。もう自分が記事を集めたりドキュメントしたりすることはないんだろうなと思った。こんなにきれいにコミュニティの世代交代が進むなんて正直思ってなかった。あとは若手にsushiとbeerを投げつけつつ、趣味で自分が面白いと思えることに専念していこう。

今日はこの辺で。


近況報告 2019-03

  • ほぼ一年ぶりに北海道へ。SappoRo.Rは本当に楽しかった。特にサッポロクラシックとジンギスカンが最高だった。またお金を貯めて北海道旅行を計画しよう。
  • ほぼ一年ぶりに広島へ。ベイズ塾合宿は本当に楽しかった。特にもん善別館ともみじ亭が最高だった。またお金を貯めて広島旅行を計画しよう。
  • 再検査の結果、問題なしとなった。これで問題なく #ビールうめぇ できるぞヒャッハー
  • 3/31から4/2にかけて、上の子と二人で青春18きっぷの旅に出ることにした。上の子が順調に鉄ちゃんへの道を歩んでる。
  • 転職して一年。「自分なんかがここにいていいのだろうか」と何度も思い悩む日々だった。これからも思い悩むだろうけど、やっていくしかない。ひたすら黒軸キーボードと叩いていく。
  • 転職してからずっとお世話になってた方が退社することになった。広いようで狭い業界なので、きっとまた出会う場面はあると思う。でも泣くけど。
  • 今月頭から所属してたチームが室に上がり、自分の所属がLINE FukuokaのDataLabs室DataAnalysisチームになった。そしてチーム長を拝命した。せっかくの機会なので、managerとしてのenjoyを追求していきたい。


いつのまにか大晦日は実家で飲みながらこういう記事を書くのがお約束になりました。

毎年、年始に「今年の抱負みたいなもの」を書いていたのですが、今年はそれを書きませんでした。なので今回は密かに設定していた目標を晒すとともに、その達成度も書いていきます。

  1. 転職: ○
    無事に転職し、故郷の福岡に戻ってきました。21年ぶりです。3月末までバタバタ、そして4月からもバタバタしてました。人生で初めての転職、そして職種・業種も変わるということで不安しかありませんでしたが、なんとか9ヶ月生き延びることができました。多くの方に感謝します。
  2. 出版: ○
    #宇宙本 こと「RStudio 実践入門」が出版されました。執筆出版に関わってくださった皆様、そして手にしていただいた皆様に感謝します。
    昨年は #犬4匹本 を出版させていただき、2年連続でありがたいです。自分なんぞでいいのかと思いつつ、来年以降も頑張りたいと思います。
  3. ライフワークの改善: ○
    毎年これを掲げては☓をつけてましたが、ついに改善できました。あまり多くを言えませんが、4月から帰宅時間がかなり変わりました。そして休日はきっちり休むようになりました。みんな驚かれてます、はい。
    来年はもっと時間外を減らしていきたいと思います。
  4. 多言語に手を伸ばす: △
    現職ではSQLを書けないと仕事にならないので、4月からひたすらSQL(主にPresto)書いてます。Rよりも書いてる時間長いです。Rでgroup_byをgroup byと書いてミスることが多くなりました。
    もうRおじさんじゃなくてただのおじさんですね。
  5. outputを出していく: △
    ここ数年と比較すると、outputがかなり減少していました。プレゼンだと…
    - SappoRo.R #8 (2月、1件)
    - fukuoka.R #10(3月、2件)
    - 日本社会心理学会2018年春の方法論セミナー(3月、1件)
    - Tokyo.R #71(7月、1件)
    - fukuoka.R #11(9月、1件)
    - Japan.R 2018(12月、1件)
    - LINE Developer Meetup #47 in Fukuoka(12月、1件)
    こんな感じです。なおWeb記事はほとんど出してません。4月から数ヶ月は意図的だったんですが、最近は余裕がなくて書いてませんでした。アカンですね。

だいたいこんな感じです。
思ったより目標を達成できました。今年はもう転職が全てですね、はい。

あと個人的なこととしては、東京へ家族旅行で行き、子どもたちを鉄道博物館・スカイツリー・東京タワーへ連れていくことができました。来年もまた家族でどこか遊びに行けたらいいなと思ってます。

来年もマイペースでやっていけるように頑張りたいと思います。どうか来年もよろしくお願いいたします。


近況報告。

転職して家族で福岡に移って三ヶ月半経ちました。少しずつ生活のリズムができてきたところです。でもまだまだなれてないことが多く、油断すると「ほげほげじゃけぇ」と言ってしまいます。福岡出身なのに。

仕事に関しては、自分の中ではまだまだだと日々痛感しています。 毎日スキルを習得し磨いていかないとすぐに置いていかれるので、緊張感を持ってがんばります。

いろんな方に心配されていましたが、元気にやっています。子どもたちの寝顔を見る日々からお休みなさいを言う日々になれたのはよかったなと思います。

とまあこんな感じで、四十代の自分へバトンを託したいと思います。楽しんでな、自分。


タイトルのように、6/29に以下の書籍が出ます:

共著者から「熱い思いを書いてくれるはず」とトスを受けたので、私なりにこの書籍をご紹介したいと思います。

まず本書は以下の構成となっています(担当者名はtwiiterアカウント):

  1. RStudio入門(担当: y__mattuさん)
  2. スクレイピングによるデータ取得(担当: y__mattuさん)
  3. dplyrを中心としたデータハンドリング(担当: yutannihilationさん)
  4. ggplot2による可視化(担当: kyn02666さん)
  5. R Markdownによるレポーティング(担当: kazutan)

これだけ見ると、「ああよくあるR入門書籍かな」と感じるかもしれません。しかしそれらと決定的に違うのは各トピックの「濃厚さ」です。私達が目指したものは「ただのさらっとした入門書」ではなく、「本格的、そして実践的にRを使っていくために必要なものを詰め込んだ決定本」です。第一線でR/RStudioを使い、またR勉強会や講演、Webで多くのことを発表してきたメンバーによる、厳選された内容となっています。各章の解説や紹介についてはメンバーがそれぞれ書き起こしてくれると思うので、全体的な紹介と私の担当したR Markdownについて紹介します。

本書のテーマの一つは「tidyverseに準拠した分析ワークフロー」です。分析と一言で言っても実際にはいろいろな工程を含みますし、それを意識しておかないと出戻りやトラブルの原因となります。本書はその分析ワークフローを意識してもらい、それをR上で実践していくためにtidyverse準拠としました。
詳しくは「はじめに」に書きましたが、分析者はこのワークフローを意識して遂行しないと手のうちようがないというのが現状です。「じゃあそれをどうやって意識して実現していけばいいのよ?」という問いに対し、本書は実践的なコードと第一線で活躍するメンバーによるちょっと踏み込んだ解説で回答します。ちょこちょこ著者陣によるややマニアックな説明が入っているので、こなれたRユーザーの方はそこも楽しんでもらえれば幸いです。

本書のもうひとつのテーマは「RStudioを使い倒す」です。RStudioはもっともメジャーなR向けIDE(統合開発環境)ですが、その全ての機能を把握するのは困難です。またRStudioの開発スピードは目覚ましく、実際本書を執筆している間にRStudioのversionがあがって機能が追加されたという事態にも遭遇しました。
幸い著者メンバーはpreview版からチェックしており、執筆中のアップデートであっても即座に検証して対応し、本書にまとめていきました。この対応レベルは他書よりも遥かに高いレベルでしょう。
しかし、このように書くと「だったらこの本で書いてるRStudioの機能ってどうせ使えなくなるんじゃね?」と思われるかもしれません。これは本書に限らず技術書全般で言える問題です。そこで本書は陳腐化しないようコアな機能を中心に、さらに知らないと損をするような機能を重点的に紹介しています。でも著者陣はその中でもあまり知られてない便利な機能を差し込んでいます。ぜひ探してみて使ってみてください。
他にも魅力は多々ありますが、他の執筆陣の紹介記事に譲りたいと思います。

私が担当したR Markdownについて軽く紹介します。
R MarkdownはRでドキュメントを生成する”システム”です。3年ほど前では国内ではあまり取り組んでいる人は少なかったのですが、最近では国内でも非常に注目を集めています。ずっと布教してきた私としては嬉しい限りです。
R Markdownは非常に奥が深く、やろうと思ったらどこまででも楽しめてしまうという魅力があります。私はその魅力にとりつかれた一人なのですが、今回は「分析のレポーティング」に絞りました。R Markdownに対する苦情として「機能や設定が多すぎてもうわからない」というのをよく聞きます。それへの私からの答えとして、今回まとめたつもりです。まずはシンプルにhtml_documentからはじめてください。慣れてきたら、私を始めいろんな人に「こういうのが不便/できないんだけどどうしたらいい?」と振ってみてください。きっと次のステップへ進むことができるでしょう。

最後に、本書は編集Tさんがあって初めて成立した書籍だと思います。このような機会を与えてくださったTさんおよび他の著者陣に対し深く感謝します。
そして多くの方が本書を手に取り、みなさんのRによるデータ分析がtidyverseの名の通り宇宙のように広がりを持つことを祈念しております。

Enjoy!


退職しました。

今月末を持ちまして、比治山大学を退職しました。11年間、家族を始め多くの方に支えられ、なんとかやってこれました。関わった多くの方々に感謝いたします。

4月からは私の地元福岡にある民間企業にて分析を中心とする仕事に着きます。うまくやっていけるかどうか非常に不安ですが、これまでの経験をいかしながら、新しいことにチャレンジしていく所存です。今後とも皆様のご指導ご鞭撻のほど、よろしくお願いいたします。

今回の転勤に関する諸々についてはここでは触れるつもりはありません。どうしても気になる方は、直接お会いした際に聞いてください。

Rコミュニティに関する活動ですが、これまでのようにあちこちへ気軽には動けなくなるかなとは思います。でも隙あらばお邪魔しようと思いますので、見かけたら話しかけてもらえると嬉しいです。また、fukuoka.Rのコアメンバーに入れてもらえたので、fukuokaからいろいろ発信できたらなと思います。

という事で、退職エントリーでした。


blogの再整備中。

ここ数ヵ月blogを更新してないのですが、実は不具合が発生してるためです。

私のblogは昨年よりblogdownで作るようにしてたのですが、あるタイミングからbuildがうまく通らなくなってしまいました。

初期のblogdownに対応させていろいろ弄ってたから、多分作り直した方が早いだろうとは思ってます。でもまとまった時間を確保して原因を特定したりカスタマイズするだけのいろんな余裕がなく、放置状態になってます。すみません。

多分2月半ば位まではものすごくバタバタなので、Webサイトとあわせて再整備します。もうちょっとお待ちください。


2017年の振り返りみたいなものでも。

ここ数年やっているんで今年も。今回はmediumに置くことにした。基本的にはこれへの返答です。

ワークライフバランスを考える……△
例年だとこれが×なのですが、今年は以前よりも多少改善された気がする。なにより最終バスに乗る回数が減ったので。でもまだ過剰なのでもうちょっと考えます。

Webサイト再構築……△
自分のサイト自体は更新できてないですが、ブログをリニューアルしました。ついにblogもRで構築する時代になりましたね。来年は諸事情により完全にリニューアルする予定です。

R関連ドキュメントの整理……△
今年、重い腰をあげやっとKazutan.Rのサイトを作成しました。これからも整備していきます。ただ、データハンドリングのドリルを作りたかったけど全く進んでいません。きっと、そのうちに。

他言語に手を伸ばす……×
SQLとPythonはきっちりやろうと思っていたのですが、まだまだ修行不足です。どちらかと言うとJavaScript書いてた時間のほうが長かった気がする……。来年はまずSQLを鍛えたいと思います。

その他としては、やはり犬4匹本が出たのが思い出深いです。あとはtubeplayRパッケージやfullpagejsパッケージなど、ついにRパッケージを作ることができました。ドキュメントとかをもうちょっと整備したら、CRAN目指してみたいです。

というわけで、2017年は大変お世話になりました。来年もどうかよろしくお願いいたします。

Enjoy!

kazutan

#ビールうめぇ

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store