docs/algo/data_format.md
每行文本表示一个样本,每个字段以" "(空格)分隔,每行的文本格式
label index1:value1 index2:value1 index3:value3 ...
其中
# libsvm样例数据
1 1:0.5 3:3.1 7:1.0
0 2:0.1 3:2.3 5:2.0
1 4:0.2 7:1.1 9:0.0
....
每一行为一条记录(一个样本),每个字段以" "分隔,每行的文本格式
"label index1 index2 index3"
# 数据格式样例
0 3 7 999 666
1 0 2 88 77
...
如果输入数据的分隔符不是空格, 可以用如下参数来指定分隔符, 如指定主逗号:
ml.data.splitor=,
对于Softmax回归等多分类算法, 标签要求从0开始, 其它二分类算法标签为正负1. 如果要对标签进行转换, 可以用下面的参数: