NLP2024神戸大会でスポンサー賞をいただきました!

3/11から神戸で開催されれていた言語処理学会(NLP2024)に、NICTでRAの根本さんとの共同研究を発表したのですが、それがスポンサー賞を受賞しました。
それについてのコメントが学会のWebで公開されたので、お知らせします。
私たちのものを抜粋しておきます(^。^)
Helpfeel賞
P2-1 クラスタリングによる自由記述回答の要約と選択肢回答空間に射影による解答群間の連関の可視化
根本颯汰, 藤本一男 (NICT)
アンケートにおける自由記述の理解に関する研究は,ユーザーの声を最大限に尊重するうえで非常に欠かせないものだと共感しています.さらに,実際の分析現場で求められる分析項目への柔軟なマッピングや,これらの可視化は,データからの洞察を深める上での有用性を感じます.新手法の提案に加えて,実運用でのドッグフーディングと並行して進めている事例として,大変勉強になりました.ありがとうございました.
上記タイトルの論文は以下からPDFでご覧いただけます。
全体の構成は、以下のようになっています。1)多重対応分析MCAをもちいて選択肢解答設問から変数空間と個体空間を生成する。2)機械学習を用いて、自由記述部分のクラスタリングを行い、それを変数化する。3)変数化したクラスタ番号を「追加変数」として1)で生成した個体空間に射影する(構造化データ解析SDA)。4)そこで生成されたマップをもとに、解釈を行う。
受賞理由では、この全体像を評価していただいたことがわかります。感謝です。
上記論考の図1として張り込んだ全体の構成図は以下のようになっています。
また、昨年度のRAの大畑さんとの共著論文(NLP2023で発表)が、朝日新聞社メディア研究開発センターの新妻さん、田口さん、田森さんによる論文で参照していただきました。以下のリンクをご覧ください。
計量テキスト分析のための文埋め込みによる探索的カテゴリ化
カテゴリー: Python, R, Tools, 対応分析, 機械学習 | コメントする

あけましておめでとうございます!

謹賀新年
Happy New Year!
새해 복 많이 받으세요
Frohes neues Jahr!
Bonne année !
¡Feliz Año Nuevo!
Godt nytt år!

May a world without warfare come!

Oriental Zodiac Ema
Original design: Isao Honda
Made by: yuko

カテゴリー: 未分類 | コメントする

「インターネット時代の文章読本」1996、epub版です

ずっとずっと昔(1995年!)の講演をまとめたものを「三愛新書」に入れていただいていたのですが、すでに手にはいらないし、epubにしてありました。ただ、ベタのepubのままだったので、ちゃんと(^^)/「目次」をつけてみました。中身はxhtmlなんですね。htmlのタグつければいいだけでした。

スマホでも読めるのでしょうか….。

なお、時代的に、WIndows95が登場した当時のものなので、技術的な部分は、むかしむかしのお話です。ですが、ライティングツール的にIT機器を使う、文章を書く、という視点は今でも古くはないと思っています。

これに、アウトラインプロセッサ、マインドマップ、テクニカルには、OPML、というのを加えて、一冊にまとめてみようかと٩( ᐛ )و

https://419kfj.sakura.ne.jp/db/wp-content/uploads/2023/12/インターネット時代の文章読本edv1.1.epub_.zip

カテゴリー: Tools | コメントする

2023/09/06東大SSJDA「計量分析セミナー」で使用したスライド集

9/6に東大SSJDAの「計量分析セミナー」で講師をつとめさせていただきました。1日コースに対して、ちょっと盛り込みすぎた、という反省もありますが、スライドを公開します。ご意見いただければ幸いです。

計量分析セミナーで使用したスライド集

 

 

カテゴリー: 未分類 | コメントする

sakura VPSにRStudio Server/Shiny Server を立てる

2023年4月の試行錯誤の報告です。サクラVPSにRStudio Server とShiny serverをたてました。

レポートはこちら

その半年くらい前に「月曜日の勤め先」の所内サーバーに同じことをやっていたのですが、かなり使い勝手がいいので(そこではデータの持ち出しもないし)、個人ようにもつくりたいと、いかに安くできるか検討中でした。
メモリの量で料金がきまるので、最初は1Gでスタート。しかし、それだと、パッケージのコンパイルでエラーになっていて、アウト。あれこれやっていてわかったのは、スワップ指定をすれば回避できるということ。パッケージのコンパイル時だけメモリを使うので、その時はちょっとパフォーマンスおちますが、まあその時だけ我慢すればいいので。

結局1Gメモリで3Gスワップで使える環境ができた!という報告です。

いろいろ探していて、みつけたので、忘れないうちに、公開しておきます。

 

カテゴリー: R, 対応分析 | コメントする

ITリスク学研究会でのスライドを公開しました。

ITrisk-CA-MCA20230722v1.1

カテゴリー: R, セキュリティ, 対応分析 | コメントする

計量分析セミナーで「対応分析/多重対応分析の原理と実際」を話します

東大社会科学研究所附属社会調査:データアーカイブ研究センター:CSRDAの「計量分析セミナー」2023のプログラムが公開されてました。
「対応分析」で講師をやります。
シラバスは、ここにリンクされています。
カテゴリー: R, 対応分析 | コメントする

ITリスク学研究会で話します。講演2です。


2023年度第2回ITリスク学研究会実施案内
⽇時:2023年7月22日(⼟)16:00-18:00 (WEB会議)

講演1
タイトル:システムのデジタルトラスト —サイバー空間とフィジカル空間の⾼度な融合のためのトラスト—
講演者:松本泰⽒(セコム(株)IS研究所 顧問)
概要
リスクとトラストは、⾮常に密接して関係にある。また、ITリスク学に対してITトラスト学(ないしデジタルトラスト学)は学問領域として検討されるべきかもしれない。
このトラストは、哲学、社会学、⼼理学、経済学、法律などさまざまな分野で発展してきた概念だが、デジタル社会の到来という社会が変⾰する中、システム・情報科学技術分野においても重要な概念として浮上している。本セミナーでは、デジタル時代における新たなトラストの概念とも⾔える「システムのデジタルトラスト」について説明するとともに、このトラストを⽀えるプラットフォームセキュリティ技術の動向について説明する。

講演2
タイトルセキュリティ技術者のためのカテゴリカルデータの統計分析法⼊⾨
講演者
藤本⼀男⽒ (津⽥塾⼤学 数学・計算機科学研究所 特任研究員)
講演概要
セキュリティに関連して調査などを⾏うと数値としては取得されないデータ(カテゴリカル・データ)の扱いが必須となります。たとえば、5、4、3、2、1というコードが回答「とても当てはまる」「当てはまる」「どちらでもない」「あまり当てはまらない」「全く当てはまらない」に対応して付けられているとします。このような設問が複数⽤意されている時に、その設問ごとの平均値、分散を計算して⽐較することはデータ構造を破壊して⽐較しています。
こうした場合に適⽤できるものとして「対応分析」という⼿法*があります。
今回の報告では、対応分析がどのようなロジックでカテゴリカル・データを「数量化」し、統計処理するのかをいくつかの事例を交えてご紹介します。


参加希望者はITリスク学研究会it-risk[at]jssm.net (主査・幹事)までご連絡ください。
以上


*対応分析とはどのような手法であるのか、について藤本の以前の勤め先の図書館のニュースレターに紹介したものがあるので、ご参照ください。

カテゴリー: R, セキュリティ, 対応分析 | コメントする

iPadのアウトライナー(dynalist)からexport

日常的なメモ、作業記録は、アウトライナー(dynalist)でやってます。これ、iOS/iPadOS でも、macOSでも使えるし、Web版もあるので、利用環境選ばすのすぐれもの。

ただ、アイデアの類、スライドの構成したがきなどは、次の処理が必要です。

アイデアを書き留めておくだけだと(例によって…)散逸するだけ。

そこで、アイデアは、定期的にひろあげてまとめる作業が必要(同じことを発見!として喜んでいたりしますが..)だし、スライドの構成はPPTなりにまとめないとしょうがない。

そのためには、export機能で、OPMLで出力するかPlain TextかFormattedで、出力します。

Formattedでクリップボードに書き出せば、Evernoteに貼り込めるし、OPMLで出力すれば(拡張子をxmlにして)alldocs.app(https://alldocs.app/ セキュリティが心配な人/データは、自分の環境でpandocで処理)でwordに変換して、それのアウトライン、フォント、色などを修正して(Windowsならそのままdocxで)rtfにして保存、PPTでアウトラインとして読み込めばOK。

後者、かなり重宝してます。

で、ここで本題なのですが、iPadやiPhoneでつくったアウトラインをどうやってexportするのか。実は、iOSアプリだと、このexportメニューがでてこない….。WindowsなりMacがあれば、そこでやればいいのですが、スマホやタブレットで先にすすめたい時にはどうするか。

dynalistのWebアプリを使えばできるはず、と思ったのですが、これがNG。iPadのChromeではだめでした。iPadOS用のアプリと同じ開き方。

そこでやってみました。Safari(滅多につかわないのですが…)。こちらでは無事にexportメニューがでてきます(^。^)。

で、スライドをつくるのは、WindowsやMacじゃん、ということになると無理してiPadでOPML export しなくてもいいのですが…(^^;)。

(OPMLすれば、そこからmarkdownにも変換できるし、その変換ができれば、RStudioに読み込んで処理できるのですよね。RStudio.cloud を使いますが(^^)。RStudioからBeamer Presentation)← 趣味のデータ変換( T_T)\(^-^ )

ともあれ、メモφ(・

 

 

 

 

 

 

 

カテゴリー: Tools | コメントする

恭賀新春2023

明けましておめでとうございます!

새해 복 많이 받으세요!

新年快樂!

Happy new year!

Felice anno nuovo!

Feliz año nuevo!

Frohes neues Jahr!

Bonne année!

カテゴリー: お知らせ | コメントする