投稿

8月, 2021の投稿を表示しています

再構築のためにやったこと

イメージ
クラウドのインスタンスとして選択したのはUbuntu (server) 20.04です.CentOSなど他にも選択肢はあったのですが,Ubuntuに慣れていることからこれを選びました. 環境構築 最初にやるべきことは,sudo apt-get install build-essentialです.これをやらないと何も開発できません. 続いて,anyenv → rbenv, nodenv, pyenv を導入しました.Railsの開発をするためにrbenvとnodenvが必要で,Twitterからデータを取ってきて処理するツールをPythonで動かしているのでpyenvも必要です. これらを使ってruby, nodejs, pythonなどの環境を構築します.環境構築に際してときどき「このライブラリが足りない」とか「このツールがない」とか,様々なメッセージが出てくるので都度,sudo apt-get hogefuga のおまじないで対応してください.いちいち記録は残していませんが,エラーや警告が出ても言われたとおりに対処すれば問題ないはずです. sqlite3や,graphvizなど,TWtrendsで利用している周辺のツールもインストールします.これもとくに問題はないはずです. GitHubからTWtrendsのソースコードをcloneします.だいぶ古くなっているのでそのままでは動きません.いずれ,最新版にアップデートしておかないといけませんね. ちょこちょこと必要な修正を加えたら,bundle updateして環境をアップデートします.あとは,TWtrendsソースツリーの最上位ディレクトリにおいて,次のおまじないを打ち込めばテストデータでのTWtrendsが動作することを確認できます. bin/rails db:create; bin/rails db:migrate; bin/rails db:seed; bin/rails server ただし,3000番ポートへのアクセスを開けないといけません.これがなんだかうまくいかなくて,クラウドのサーバでこの方法を試すことができなかったんです.誰か教えて偉い人…… Apacheとの連携 phusion passenger を導入して,80番ポートからアクセスできるようにします.その前に,sudo apt-get ins

パラリンピック・屋外フェス・焼肉の部位

イメージ
昨日,Twitterで何が話題になっていたか,TWtrendsのトピックマップをみると一目で理解することができます.Twitterというフィルターがかかっているとはいえ,その日に話題になったことが取り上げられることもあるので,社会の動向をウォッチするよいトレーニングになる,かもしれません. パラリンピック観戦中止 千葉県で子供たちをパラリンピック観戦に行かせるのを中止させたそうです.まあ,妥当かなというところですが,その理由がちと情けない.なんでも,引率教員に感染者が出たから,だとか.想像力の欠如というか,泥縄というか…… 逆にそんなに利権守りたい?のなら,引率者に多少の感染者が出たからといって強行するぐらいの覚悟持ってやれや!とも感じちゃいます. 大規模屋外フェス批判 愛知県で開催された比較的大規模な音楽フェスが,感染対策を十分にしていなかったからといって批判されています.どうも主催者側もけっこうテキトーな対応で,批判されてもやむかたなしという印象.しかし,なんだかそういうことが起こると世論が一斉に叩くのって,戦前の五人組みたいでなんとも嫌な感じもするなあ. あなたを焼肉の部位に例えると 最後はほっこりした話題です.サンチュだのサーロインだの,シャトーブリアンだのといった美味しそうなキーワードに,なぜかドM体質とかあがり症とかストイックとかのキーワードが結びついています.これ,「診断ドットコム」とかいう診断系のアプリだそうです. 今日は焼肉の日!ということで、あなたを焼肉の部位に例えると、何のお肉のどの部位になるのかを診断しちゃいます! ですって.前日の29日に流行っていたのがそのまま尾を引いていた,ということですね.それにしてもみんな診断系サイト好きですなー.

新TWtrendsの運用環境

イメージ
これまでのTWtrendsは,Cloud n(クラウド・エヌ)というパブリッククラウドサービスを利用していました.これは月額500円という安さでわりと使い勝手もよかったのですが,なにしろ12GBしかストレージがなく,メモリも500MBという小ささで,いろいろと問題が生じていました. phusion passengerをインストールしようとしたらスラッシングが起こりまくってコンパイルに8時間かかったなどという笑い話も……(よくもまあ我慢して粘ったものです).そしてCPUのリソースが不十分なせいか500 Internal Server Errorがしょっちゅう出る始末.ちょっとしたプログラムを試してみるには十分ですが,実サービスを運用しようとすると少し非力すぎて使えないというシロモノでした. さらに,途中でストレージも足りなくなって,+500円/月で追加できる40GBのディスクを確保して運用していました.つまり,月に支払っていた金額は1,000円でした. 今回利用したのはNTT,WebARENAのindigoというサービスです.料金ラインナップを見ると,月額349円からとなっています.それでもメモリが1GBなのでスラッシング祭りはなくなるかな?とも考えたのですが,余裕をみて,月額1,399円のコースを選択.ネットワークにも余裕がありそうだし,SSDも80GBとかなり余裕があります.ずいぶんとリーズナブルになったものです…… ドメインの設定 ドメインは,これまで使っていた iiojun.xyz というものを使うのはヤメにします.初年度がほぼタダという安さに釣られて xyz ドメインを使っていましたが,怪しいサイトとみなされることが多く,使い勝手が非常に悪い.オススメできません. iiojun.com ドメインも確保するだけして使っていなかったので,今回はそれを使うことにしました.サブドメインを切って,twt.iiojun.com をTWtrends専用に使うことにします. そんなわけで,プラットフォームを無事に確保することができました.次は,サーバの設定です. (to be continued)

TWtrendsに関するリソース

イメージ
これまでいくつかTWtrendsに関する情報発信をしてきました.ここでは現時点でのそれらの情報をまとめておきます. まずは学術文献です.TWtrendsの概要と大まかな内部構成など,Journal paperとして記載した[1]が最も詳しく述べています.英文ですが,簡単な英語なので読むのは難しくないと思います.[2]はJournal paperにinviteされる前の国際会議で発表したものです. 最初の学会発表は2019年春にバンコクで開催されたPacificVis2019でのポスター発表[3]です.ここに連名で並んでいるのは,当時,中央大学大学院文学研究科社会情報学専攻で学んでいた院生たちです.思えば,大学院ゼミとしてなにか面白いアプリを作れないかな?というところから始まったのが本プロジェクトでした. 日本語での論説記事は,Chuo Onlineで開設した[4]がわかりやすいでしょう.これらで紹介している平成から令和に変わる1週間のトピックマップ(次図)は,衝撃的でした. その他,電子情報通信学会のサイバーワールド研究会[5]や,社会情報学会大会などで,関連する研究例を報告しています.今後,このプラットフォームを通じて収集したデータを対象として新たな研究が生み出されることも期待しています. 参考文献 Iio, J. (2019)  TWtrends ― A Visualization System on Topic Maps Extracted from Twitter Trends ,  IADIS International Journal on WWW/Internet,   17 (2), 104-118 Iio, J. (2019)  TWtrends: The Topic-Graph Extraction from Twitter Trends ,  The 18th International Conference on WWW/Internet (ICWI 2019),  pp. 69-77, Cagliari, Italy. Iio, J., Stevie, P., Aoki, Y., Nakamura, E., Kim, S., and Lee, T. (2019) Visualization of Twitter Trends using a

TWトレンド研究所とは

イメージ
2019年1月1日から2020年12月31日まで,2年間続けていたTWtrendsが 帰ってきた !ということで,「TWトレンド研究所」(TWtrends laboratory, 略称「ツイトレ研」)というブログを立ち上げることにしました. TWtrendsとは TWtrendsとは,ツイッターのトレンドを収集し,さらにそのトレンドに関連するツイートを収集してトレンドの傾向を分析,トレンドごとの類似性を加味したトピックマップを作成するWebアプリケーションです.詳しくは参考文献を見てください. トピックマップはこんな感じの図です.これは2019年1月26日のトピックマップです.全豪オープンで大坂なおみ選手が優勝した日に出現したトレンドを分析して作成した図です.大坂なおみ選手に関連した大きなクラスタが中心に現れており,ツイッター投稿者の大きな関心事項であったということがわかります. このブログでは何をするのか 旧TWtrendsの運用時には,毎日,前日のトレンドを解釈して感想をSNSに投じるという活動をしていました.それと似たようなことをブログで書き溜めていこうと考えています.その他,TWtrends開発秘話など,気が向いたら書くようにします.最終的には一冊の本になるといいな. 参考文献 Iio, J. (2019)  TWtrends ― A Visualization System on Topic Maps Extracted from Twitter Trends ,  IADIS International Journal on WWW/Internet,   17 (2), 104-118 Iio, J. (2019)  TWtrends: The Topic-Graph Extraction from Twitter Trends ,  The 18th International Conference on WWW/Internet (ICWI 2019),  pp. 69-77, Cagliari, Italy.