問題

edit遅すぎる

どれだけ遅いかというと,

# 今のところの平均
>>> 2567.7/ 464
5.533836206896551

# BM25
>>> 274.701 / 4510
0.06090931263858094

最高に早いな

3000件づつ検索を行っているが,遅い

今のままだと

# edit
>>> 5.533836206896551 * 4509
24952.06745689655 sec -> 6.9311298491379309539 hour

# BM25
>>> 0.06090931263858094 * 4509
274.64009068736146 sec -> 0.076288914079822633951 hour

jwの結果が出たらしい

11050.3 -> 3.069527778 hour

# 平均
>>> 11050.3 / 4509
2.4507207806609004

# 件数
20344608

# 検出漏れ

editもそれにつづく

# 0.25
40009
2792
33026
1957
34

# 0.5
5300
2792
4380
1957
34

# 0.75
4359
2792
3572
1957
34

0.75だとしても検索件数は同一

ちゃんと検索できたやつは同一ファイルの組みなのか?

34

なんで4509組み出てこないんだ?

gcpでやったただ10件検索して出した結果群を苦し紛れに投下

5014
2792
3866
1957
34
313

やっていること違うけど,こっちの方が同じような奴出てくるな?

わからん