トップ «前の日(03-17) 最新 次の日(03-19)» 追記   RSS 1.0 FEED  

Journal InTime


2004-03-18 (Thu)

_ [ソフトウェア] www.eclipse.org

www.eclipse.orgがDNSで引けなく なっているようだ。何でだろう。

追記:

whoisしてみると、一見問題なさそうだけど、よく見るとStatusがINACTIVE になっていた。このせい?

Domain ID:D213060-LROR
Domain Name:ECLIPSE.ORG
Created On:14-Apr-1997 04:00:00 UTC
Last Updated On:17-Mar-2004 21:46:01 UTC
Expiration Date:15-Apr-2012 04:00:00 UTC
Sponsoring Registrar:R63-LROR
Status:INACTIVE

最後の更新が日本時間で今朝か。

さらに追記:

今見たら、どうも直っているようだ。

Domain ID:D213060-LROR
Domain Name:ECLIPSE.ORG
Created On:14-Apr-1997 04:00:00 UTC
Last Updated On:18-Mar-2004 13:26:42 UTC
Expiration Date:15-Apr-2012 04:00:00 UTC
Sponsoring Registrar:R63-LROR
Status:OK

_ [プログラミング] execと末尾呼び出し

execファミリとSchemeなどの末尾呼び出しって何か似てるなと、ふと思っ た。 ただ思っただけなので、だからどうだとかいう考察は一切なし。

本日のツッコミ(全3件) [ツッコミを入れる]

_ masaking [wが4つだからでは?]

_ shugo [あ、typoがありました、すみません。 でも会社ではnsレコードすら引けなかったんですが、会社の環境がおかしかったの..]

_ shugo [家では一回引けたけどまた引けなくなりました。うーん、よくわからん。]


2005-03-18 (Fri)

_ [ソフトウェア] rast-mecab

なんてものを作ってみた。

Rastでは、N-gram(というかトークン)の切り出しをエンコーディングモジュール というものに独立させているが、この部分でMeCabによる形態素解析を 利用しているだけ。

RastとMeCabがインストールされている環境で、

$ ./configure
$ make
# make install

とすれば、インストールできる。

とりあえず、デモN-gram版より結果の件数が少ないのは1万件弱しか 登録してないから。

Rastは隣接チェックを行うので、 趣味の問題 のようなキーワードもちゃんと検索できる。 一方、隣接チェックがない検索エンジンでは 趣味 問題 のようなノイズの多い検索結果になると思う。 辞書も小さくなるし、N-gramよりもいいケースもあるかな。

N-gramの利点の一つに、顧客に 「○○という単語で検索できない」と言われた時に、「そんな文字列は もとの文書に含まれていませんから許してくださいよ」と説明できるということがある。 任意の部分文字列の検索(要はfgrep)ができるからだ。 「これは形態素解析器の辞書がですね...」という説明で納得してくれれば いいけれど、あなたの顧客はそんなに物分かりがよいですか? *1

ここでちょっと考えたのだが、基本的に形態素解析でトークンを切りだし、 未知語が表れたらその部分だけN-gramで処理するというのはどうだろうか。 大多数のケースで良好な結果を得られそうな気がする。

あと、Rastで使う時は、形態素解析器にはなるべく単語を細かく切ってほしい。 たとえば、「日本語」よりも「日本 語」の方が好ましい。 前者だと「日本語」で検索した場合はヒットするが、「日本」ではヒットしない。 一方、後者なら両方にヒットするし、隣接チェックがあれば「日本語」の検索結果 のノイズも増えない。 MeCabをこういう方向にチューニングすることができないかな。

*1  インデックス生成時に単語レベルで正規化したりすると、このメリットが 損なわれるので、曖昧検索などを実装する際はOR検索のような方向性の方が 望ましいかもしれない。 すでに、Rastでは、「tcl/tk」のように規定のN(アルファベットでは3) より短いトークン(「tk」)がある場合には、前方一致検索を行った結果を マージしているので、同様に語尾の揺れなどにも対応できそうだ。

本日のツッコミ(全2件) [ツッコミを入れる]

_ ty [mecabのN-bestでN=2にしたら以下のようになりました。 obiwan% echo '日本語' | meca..]

_ shugo [なるほど、そういう手がありましたか。]


2007-03-18 (Sun)

_ SoftBankメール

無線LANと相性が悪いらしいので導入は見送り。 担当者は大変そうだなあ。 がんばってください。 私もがんばります。


2012-03-18 (Sun)

_ [バイク][KLX125][買い物] バイクスタンド

バイクスタンド

ずっとKLX125のチェーン掃除は車用のジャッキでスイングアームの右側だけジャッキアップして行っていたのだが、ジャッキがヘタってきてなかなか上がならくなってきたので、オフロード用のバイクスタンドを購入した。

DRCのやつは高いのでアストロプロダクツのを買おうかなと思っていたのだが、ストレートというメーカーでもっと安いのがあったのでそちらにした。 最低高さ245mmなので、アンダーガードを付けたままでもちゃんと入る。

最初、駐車場の微妙な傾斜のせいでリアがなかなか上がらなかったが、バイクの向きを変えてフロントが低くなるようにしたら余裕で上がった。

というわけで、ひさびさにチェーンを掃除して大分きれいになった。

チェーン

しかし、あちこち錆びてきてるなあ…。もうちょっとマメに手入れをしなければ。

チェーン調整もしたかったけど、サイズ22のレンチとか替えの割ピンとか色々道具が足りないのでまた今度にしよう。