菊池 Blog

移転しました 続・菊池 和彦の足跡


AILight Blogs

目次

Blog 利用状況

ニュース

移転しました http://aka-kazuk.spaces.live.com/

記事のカテゴリ

過去の記事

カテゴリ

移転先

Simian おそるべし

Simian: Similarity Analyser v2.2.7 ( NWiki 1.0.5 - Simian2.2.7 by 中西さん) に釣られた

コードはコピーするな、共通化しろと、口すっぱく言ったプロジェクトを食わせた。

Found 15329 duplicate lines in 1122 blocks in 226 files Processed a total of 52611 significant (113680 raw) lines in 384 files Processing time: 2.250sec

がーん。

とりあえず、子一時間お説教をしてやらんといかんなと…1122箇所全部について重複が避けがたい理由を説明しろとか言ってみたいなぁ…

#Simianのアウトプットを見るのに便利なブラウザが欲しいねぇ、とか思った。(作るかな)

投稿日時 : 2005年10月26日 14:38

コメントを追加

# re: Simian おそるべし 2005/10/26 18:42 石野 光仁

面白そうだったので、自分のも掛けてみました。

AIFS
Found 1002 duplicate lines in 110 blocks in 25 files
Processed a total of 5840 significant (13935 raw) lines in 63 files
Processing time: 0.359sec

AIFS-Client
Found 273 duplicate lines in 30 blocks in 16 files
Processed a total of 2824 significant (5500 raw) lines in 17 files
Processing time: 0.219sec

どの辺を目標にするといいんですかね?

>Simianのアウトプットを見るのに便利なブラウザが欲しいねぇ、とか思った。(作るかな)

おぉ、お願いします。m(__)m

# re: Simian おそるべし 2005/10/26 19:55 菊池

んーと

 AIFSは1002行が110箇所で重複してるね。実コードは5840行、5840行のうち1002行が重複だから17%かな、規模的に小さい割には重複が多い気がする。

 AIFS-Clientははるかに良く2824行中273行が重複、10%以下だね。

>どの辺を目標にするといいんですかね?

 5%以下とか言って見たいけど、AIFS-Clientのつぶせる重複をつぶしたらどれぐらいの%になる?
 
 明確に重複させる理由が無い重複は避けるべきなので、30箇所と見やすい奴を重複除去してみて指標値をとってみてはどうだろう。

>>Simianのアウトプットを見るのに便利なブラウザが欲しいねぇ、とか思った。(作るかな)
>おぉ、お願いします。m(__)m

 一人捕獲とか言ってみる。

# Simian の結果ブラウザ 2006/09/15 14:20 菊池 Blog

Simian の結果ブラウザ

タイトル  
名前  
URL
コメント