AWSにpythonとjupyter labをさっくり導入する
- モチベーション
- 使用したインスタンスおよび設定
- 準備
- pythonのアップグレード
- jupyter notebookのインストール
- jupyter labのインストール
- jupyter labの自動起動
モチベーション
- anacondaを使うとjupyter labまで自動で入るので便りっちゃ便利
- だけれどもかなり容量を食うし、anacondaそのものが不評である声が聞こえてくる
- とりあえずpython実験用に小さいインスタンスを作るのであれば、それ自体を隔離された環境と考えて、venvも不要として良い
- であれば、小さいインスタンスでさっくりjupyter labを使える環境が作れると便利なんじゃないか
- 結構情報が散在していたため、いくつかのサイトの情報をつなぎ合わせて一連の流れになるようにしたかった
※念のため、今回の手順でどれくらい容量を食うのか確認してみた
【Shiny D3.js integration】Lesson01:Shinyからjavascriptにデータを渡す
Rの可視化プラットフォームであるShinyは非常に強力です。スライダや数値入力を使ってデータを再計算し、グラフを描画しなおしたりすることができ、インタラクティブな分析に有用です。一方で、Shinyで描画されるグラフ類はグラフそのものにはインタラクティブ性がありません。散布図の一部を拡大表示させたり、ツールチップを表示させたり、そういうことができるライブラリもありますが、どうしてもライブラリ依存になってしまいます。
Javascriptのデータ可視化機能も非常に強力です。様々な可視化ライブラリがありますが、やはりD3.jsが群を抜いて便利です。Javascriptはhtmlを直接操作することができ、描画したグラフそのものにインタラクティブ性をもたせる、というShinyが苦手としている部分が得意です。ところが、Javascriptは複雑な統計処理を行うのが苦手です。
ならば、お互いの苦手な部分を補い合って、複雑な統計処理部分をR,Shinyにやらせ、インタラクティブな可視化の部分をJavascript、主にD3.jsにやらせてみてはどうでしょうか?
というようなことを前々からやりたかったのですが、なかなかまとまった情報がなく、仕方なく自分で情報を集め、整理してみました。ひとつひとつ理解していかないとはまってしまうところが多々ありますので、少しずつ、進めていきたいと思います。
なお、この記事はShinyとJavascript、特にD3.js、jQueryあたりをある程度触ったことがある方を対象にしています。なるべく平易に書いていくつもりですが、はしょってしまう部分も出てくるかと思いますので、ご了承ください。
続きを読む【Rで自然言語処理】自然言語処理から見る米国映画の変遷 その弐
前回、米国映画のあらすじを用い、トピックモデルによって分析する、という実験を行いました。今回はそれに続いて、センチメント分析を行い、トピックモデルの結果との結合を試みました。
続きを読む【Rで自然言語処理】自然言語処理から見る米国映画の変遷 その壱
GWにたっぷり映画を見ました。映画ってその時代の空気を映し出しているよなぁ、と前々からなんとなく感じていたのですが、はっきりこれ、というデータがなくてむずがゆい感じがしていました。ならばいっそ、自分の手で分析してやろうじゃないか、というのが今回のモチベーションです。
※ものすごく長くなりそうなので二つに分割します。
続きを読む【AWSでShiny】AMIを使ってAWS上に手っ取り早くShiny環境を作る。
AWS始めました。
種々やりたいことはあります。ありますが、取り急ぎ、Shinyで作ったアプリを社内向けに公開したい、という目的がございまして。ぶっちゃけ、Shiny serverを自前でインストールすれば済む話っちゃ話なのです。
が、とりあえず的にShiny環境を作るのに、パブリックなAMIを使っちゃえば深く考えなくていいんじゃね?という発想でやってみました。非常に簡単なので、ほんとに手っ取り早くやるにはこれで十分かと。
続きを読む