2.9.2 读取固定格式的文本文件
固定格式的文本文件要求不同的观测数据之间的变量数目、排列顺序、变量取值长度固定不变,如图2-89所示为一个固定格式的文本文件。
(1)在菜单栏中选择“文件”|“打开”|“数据”命令,打开“打开数据”对话框。
(2)在“文件类型”下拉列表框中选择“文本格式(*.txt,*.dat)”选项,打开要读入的文本文件。
(3)打开文本导入向导。单击“打开”按钮,弹出如图2-90所示的“文本导入向导-第1/6步”对话框。
用户可以选择预定义的格式,也可以在向导中创建新格式,本例选中“否”单选按钮。
图2-89 固定格式的文本文件
(4)设置文本格式。单击“下一步”按钮,弹出如图2-91所示的“文本导入向导-第2/6步”对话框,这里有两个选项需要设置。
图2-90 “文本导入向导-第1/6步”对话框
图2-91 “文本导入向导-第2/6步”对话框
“变量如何排列”选项组:定制读入的文本文件的格式。如选中“定界”单选按钮,则表示读入的是自由格式的文本文件;如选中“固定宽度”单选按钮,则表示读入的是固定格式的文本文件,本节主要讲解固定格式文本文件的读取,故选中“固定宽度”单选按钮。
“文件开头是否包括变量名”选项组:如果源文件中包含变量名,选中“是”单选按钮,系统将变量名称读入;如果源文件中不包含变量名,则选中“否”单选按钮。本例由于原始文本文件不包含变量名,故选中“否”单选按钮。其他选项默认即可。
(5)进行观测量的相应设置。单击“下一步”按钮,弹出如图2-92所示的“文本导入向导-定界,第3/6步”对话框。该对话框中设置如下:
“第一个数据个案从哪个行号开始(F)?”微调框:用于选择数据读取的起始行,如果数据文件中包含标签,那么该数据文件的起始行就不是第一行。本例由于第一行是空行,故输入“2”。
“个案的表示方式如何”选项组:该选项组用于设置表示个案的方式,可以每一行表示一个个案,也可以用特定的编号表示一个个案。
“要导入多少个案?”选项组:该选项组用于设置导入个案的数量。如选中“全部个案”单选按钮,系统将把所有观测量导入;如选中“前(T)个个案”单选按钮,系统会导入从第一个观测到用户定义位置的所有观测量;如选中“随机百分比的个案(近似值)(P)”单选按钮,系统将随机导入用户指定百分比的观测量。本例选中“全部个案”单选按钮。
图2-92 “文本导入向导-定界,第3/6步”对话框
(6)设置变量起始点。单击“下一步”按钮,弹出如图2-93所示的“文本导入向导-定界,第4/6步”对话框。该对话框用于设置从数据文件读取变量数据的方式。选择变量之间的定界符,选中“空格”复选框,系统将根据用户指定的定界符来划分数据。
(7)设置变量名称和数据格式。单击“下一步”按钮,弹出如图2-94所示的“文本导入向导-第5/6步”对话框。该对话框用于设置变量名和数据格式,在“数据预览”表格中选择相应的变量,即可在“变量名”文本框中输入变量名称,在“数据格式”下拉列表框中选择相应的数据格式。
图2-93 “文本导入向导-定界,第4/6步”对话框
图2-94 “文本导入向导-第5/6步”对话框
(8)完成读取。最后单击“下一步”按钮,弹出如图2-95所示的“文本导入向导-第6/6步”对话框。
如果用户希望将本次设置的文件格式作为规则保存,以便在导入类似的文本数据文件时无须重新设置,可以在“您要保存此文件格式以供将来使用吗?”选项组中选中“是”单选按钮并在其后的文本框中输入文件的保存路径。
设置完成后,单击“完成”按钮即可实现固定格式文本数据的读取,图2-89文件读取的结果如图2-96所示。
图2-95 “文本导入向导-第6/6步”对话框
图2-96 读入SPSS的固定格式文本文件