2021-04-12 13:06:30
在IBM SPSS Modeler中读取数据是数据分析的第一步,无论是statistics(通常为.sav格式,SPSS的原生数据格式)、txt还是csv文件,都可以通过简单的操作实现数据的导入。以下是详细的步骤说明:
一、读取statistics文件(.sav格式)(一)简易实现
放置文件:首先,将需要读取的.sav文件(如bankloan.sav)放置在易于找到的位置。
选择Excel节点:打开IBM SPSS Modeler 18.0,在软件窗口的下方找到“源”节点区,选中里面的“Excel”节点并双击,该节点就会出现在数据流构建区中。虽然这里选择的是“Excel”节点,但SPSS Modeler也支持通过此节点读取.sav文件。

配置节点:双击数据流构建区中的“Excel”节点,进行配置。
在“文件”选项卡中,点击“浏览”按钮,找到并选择bankloan.sav文件。
确保“变量名位于”选项设置为“第一行”(如果数据的第一行是列名)。
点击“确定”按钮。
查看数据:配置完成后,可以在Modeler中看到已经读取到bankloan.sav文件。右键点击该节点,选择“类型”选项卡下的“查看”选项,可以查看数据的具体内容。此时,可以看到标题栏显示有“12个字段,850条记录”。

(二)详细说明
数据选项卡:在“数据”选项卡下,可以设置数据的读取方式,如是否跳过某些行、是否将某些列视为字符串等。

过滤器、类型、注解选项卡:这些选项卡的功能与读取Excel文件时相似,可以用于进一步筛选数据、设置数据类型和添加数据注解。
(一)简易实现
选择Text节点:在“源”节点区中找到并选择“Text”节点,双击将其添加到数据流构建区中。
配置节点:双击数据流构建区中的“Text”节点进行配置。
在“文件”选项卡中,点击“浏览”按钮,找到并选择需要读取的txt文件(如bank_response_data.txt)。
根据文件的实际情况,设置分隔符(如逗号、制表符等)、文本限定符(如双引号)等。
点击“确定”按钮。
查看数据:配置完成后,可以在Modeler中查看读取到的txt文件数据。右键点击该节点,选择“类型”选项卡下的“查看”选项,可以看到数据的具体内容,如“21个字段,3000条记录”。

(二)详细说明
文件选项卡:在“文件”选项卡下,可以设置文件的编码、是否包含列名等。

数据选项卡:与读取.sav文件时相似,可以设置数据的读取方式。

过滤器、类型、注解选项卡:同样用于进一步筛选数据、设置数据类型和添加数据注解。
(一)简易实现
选择CSV节点:在“源”节点区中找到并选择“CSV”节点(某些版本的SPSS Modeler中可能直接显示为“CSV File”或类似名称),双击将其添加到数据流构建区中。
配置节点:双击数据流构建区中的“CSV”节点进行配置。
在“文件”选项卡中,点击“浏览”按钮,找到并选择需要读取的csv文件(如PhoneLocationData.csv)。
根据文件的实际情况,设置分隔符(通常为逗号)、文本限定符等。
点击“确定”按钮。
查看数据:配置完成后,可以在Modeler中查看读取到的csv文件数据。右键点击该节点,选择“类型”选项卡下的“查看”选项,可以看到数据的具体内容,如“5个字段,10897条记录”。

(二)详细说明
通过以上步骤,小虫可以轻松地在IBM SPSS Modeler中读取statistics、txt和csv格式的数据文件,为后续的数据分析和建模工作打下基础。