diff --git a/docs/blog/index.html b/docs/blog/index.html index 1d09d08..d7261dd 100644 --- a/docs/blog/index.html +++ b/docs/blog/index.html @@ -771,8 +771,8 @@
为了便于比较不同表格识别算法的效果差异,本篇文章基于评测工具TableRecognitionMetric和表格测试数据集liekkas/table_recognition上计算不同算法的TEDS指标。
+以下评测仅是基于表格测试数据集liekkas/table_recognition测试而来,不能完全代表模型效果。
+因为每个模型训练数据不同,测试数据集如与训练数据相差较大,难免效果较差,请针对自身场景客观看待评测指标。
+RapidTable: 有英文和中文两个模型,大多都是印刷体截屏表格。具体可参见:表格识别模型
+lineless_table_rec: 训练数据部分来自SciTSR与PubTabNet,训练集共45000张。这两个数据大多是来自论文截图,所以这个模型也是比较适用于论文中表格识别。
+wired_table_rec: 训练数据为WTW,训练集为10970张。WTW数据组成有50%的自然场景下、30%的档案和20%的印刷体表格。所以这个模型更适合自然场景下拍照的表格识别。