R
wanko-sato.hatenablog.com前回、米国映画のあらすじを用い、トピックモデルによって分析する、という実験を行いました。今回はそれに続いて、センチメント分析を行い、トピックモデルの結果との結合を試みました。
GWにたっぷり映画を見ました。映画ってその時代の空気を映し出しているよなぁ、と前々からなんとなく感じていたのですが、はっきりこれ、というデータがなくてむずがゆい感じがしていました。ならばいっそ、自分の手で分析してやろうじゃないか、というのが…
AWS始めました。種々やりたいことはあります。ありますが、取り急ぎ、Shinyで作ったアプリを社内向けに公開したい、という目的がございまして。ぶっちゃけ、Shiny serverを自前でインストールすれば済む話っちゃ話なのです。www.randpy.tokyoが、とりあえず…
前回の記事、恥ずかしいことに堂々と片手落ちなことを書いてしまっていました。wanko-sato.hatenablog.comニューラルネットワークの出力から入力を逆算するには重み行列の逆行列を用いれば良い、と書きました。 が、これだけでは片手落ちで、逆行列が存在し…
wanko-sato.hatenablog.com前回、Rで簡単なニューラルネットワークを自作してみました。参考にした書籍はこちら。 ニューラルネットワーク自作入門作者: Tariq Rashid,新納浩幸出版社/メーカー: マイナビ出版発売日: 2017/04/28メディア: 単行本(ソフトカバ…
やっぱりニューラルネットワークの基礎くらいはきちんとおさえておいた方が良いだろうなぁ、ということで、取り急ぎこちらの書籍を読んでみました。ニューラルネットワーク自作入門作者: Tariq Rashid,新納浩幸出版社/メーカー: マイナビ出版発売日: 2017/04…
いまから半年くらい前ですか。juman++をインストールしようとしてどうしてもうまくいかなかったのでした。 wanko-sato.hatenablog.com が、ここ最近ふと思いついてあれこれ試してみた結果・・・ついにうまくいきました!!!といっても、実際にやっているこ…
前回、前々回とトピックモデルに関する話題を扱いました。 wanko-sato.hatenablog.com wanko-sato.hatenablog.com トピックモデルは嫌いじゃない、むしろ好きなんですが、結果の解釈が面倒なのと、やっぱり確率分布を使うため、結果にどこかふわっとした感じ…
前回、トピックモデルのLDAを用いて文書を分類し、その結果をjavascriptで可視化する、ということをやりました。 wanko-sato.hatenablog.com ただ、その結果が本当に妥当なのか、正直自信がありませんでした。一応は3Dプロットで、検索ワードと文書分類がほ…
もう7月ですね。 統計検定、終わっちゃいましたね。 結果云々を一切書いてないってことはお察しということで。 ※というか、6月末だと思い込んでいて、余裕ぶっこいていたら申し込みすらすっかり忘れていた、というオチです。はい、というわけで、今回はトピ…
前回、sinカーブを学習データとしたLSTM-RNNによる学習と予測の実験を行いました。wanko-sato.hatenablog.comその結果、比較的良好な予測結果が得られたわけなんですが、果たして本当にそれだけで満足して良いのだろうか?とふと疑問に思いました。というの…
前からなんとなく気になっていたLSTM-RNN。 LSTM-RNN(Long short-term memory Recurrent Neural Network)とは・・・なんて話をしだすときりがないので、以下のリンク先をみてください。qiita.comqiita.com要は時系列データを学習するニューラルネットワー…
前にこんな記事を書きました。wanko-sato.hatenablog.com構文解析の結果から語のつながりを抽出して意味あるいは概念のネットワークを構築しよう!というアイディアです。が、進んでいません。というのも。KNPの結果の解析がめんどくさい。というごくごくし…
前回、疎行列をクラスタリングする話を書きました。wanko-sato.hatenablog.comそこでふと思いついたのが、「数字の羅列を単語の集合とみなして自然言語処理のスキームに当てはめられるんじゃね?」ということです。どういうことかというと、 [[1]] [1] 246 3…
仕事で「超スパースな行列」を扱う必要が出てきまして。生のままで扱うとメモリが足りなくなってしまい、さてどうしたものかと思い悩んでおりました。SASでも扱えないことはないんだけれど、計算にアホほど時間がかかるので、Rで疎行列として扱ったらどうだ…
text2vecでベクトル化したあと、どうしたら面白いことができるか?を考えているのですが、それ以前の問題にぶち当たってとりあえずの解決方法を思いついたので記録に残します。
RMeCabなしでも、system()関数でMeCabに直接アクセスしてRで形態素解析ができるのでした。 RMeCabにはいろいろ便利な関数が入っていて、N-gramができる、とか、DTMが作れる、とか便利といえば便利です。が、個人的にはちょっと微妙だと思っております。とい…
ノートPCを買ってやりたかったことのひとつに「日本語の係り受け解析」があります。日本語の係り受け解析器は、有名なところでCabocha、KNPがあります。いずれもPythonバインディングが提供されており、Pythonから動作させることが可能です。Pythonバインデ…