今回 crystal でリレー書いたけど、crystal 割と好きです。
mattn
_@compile-error.net
npub1937v...haj6
Long-time #Golang user&contributor, #GoogleDevExpert Go, #Vim, #Windows hacker, ex-#GitHubStars, #runner.
僕も昔 word2vec に小町のデータを投入するというネタをやった際に集めたけど、頭がおかしくなりそうな話がたくさんあった。
View quoted note →

Qiita
男と女が寄りそうとどうなるのか - Qiita
この記事は Go Advent Calendar 2017 の記事です。 アダムとイブ 男と女が寄りそうとどうなるのか。これは神様がア...
どんな事情があれば親戚に恋バナ面接される苦行になるのか、そっちに興味ある。
/run rb
puts "#{"たけし".chars.shuffle.join}さん"
ちなみに昔、ASUS の社員が TV に映ってて社名を言った際はアスースって言ってた。
ASUS を ASUS って読んでるんですか? 僕は ASUS って読んでますね。
一番確実なのはプロフィールに「私、日本語喋ります」のラベルを付けられるようにする事なんだろうけどね。
昔、Vim で編集中のコードがどのプログラミング言語かを Vim script だけで判定するというネタをやった事があったな。


Qiita
Vim script で機械学習 - Qiita
この記事は Vim Advent Calendar 2018 の最終日 25 日目の記事です。昨日は rhysd さんの「Vim の構文ハイライトでクリ...
あぁ、Go の実装見るとトークナイズするのに trigram を使ってるから案外コード量が多いな。普通に unicode class で分割してもよさそうなのにね。
たぶん自分でモデル作るにしても一番作りやすそうな分野やね。言語名とそのテキストを無限に食わせ続ければできる。
だいたいこういうのは多言語に移植されるんよねと思ったら普通に Go もあった。

GitHub
whichlang/src/weights.rs at main · quickwit-oss/whichlang
A blazingly fast and lightweight language detection library for Rust - quickwit-oss/whichlang
unicode class である程度は絞れて、それ以外をウェイト判定って感じみたいね。まぁそうやろねというコード。
fastText がやってるのと似た感じ。
言語判定、まぁたぶん unicode code point にして float16 化してウェイトと内積したら出力層のどれかの数値が高くなるとか、そんなのでしょ?
乳
国際情勢複雑多変 中国日本関係重要性増大 両国協力強化必要 経済文化交流促進希望 平和発展共同維持努力継続予定
経済状況厳 企業努力必要 政府政策期待大 国民生活向上希望強
最近仕事忙 休日家族旅行計画中
来月京都訪問希望
今日天気良好 友人公園散歩予定