docs/datasets/layout_datasets.md
这里整理了常用版面分析数据集,持续更新中,欢迎各位小伙伴贡献数据集~
版面分析数据集多为目标检测数据集,除了开源数据,用户还可使用合成工具自行合成,如labelme等。
text, title, list, table, figure。部分图像以及标注框可视化如下所示。Text, Title, Figure, Figure caption, Table, Table caption, Header, Footer, Reference, Equation。部分图像以及标注框可视化如下所示。label.txt中的__ignore__与_background_去除。Table 1个类别。部分图像以及标注框可视化如下所示。