新闻来源:科学软件网 发表时间:2024/10/28 16:46:20 |
• 在内存中同时加载多个数据集 • 将每个数据集存储在一个数据框中 • 链接相关数据框 • 使用多个数据框中的变量,就像它们在于一个框中一样 • 多任务 • 在另一框中记录结果 • 交互式使用数据框 • 保存和加载数据框集 • 使用ado和Mata格式的数据框进行编程 • 从Java和Python访问Stata数据框中的数据 创建和数据框 内存中的数据集以数据框的形式存储,每一个框都会被命名。当Stata启动时,它会自动创建一个名为default的数据框。
创建数据框命名为 myframe . frame create myframe
删除现有数据框:oldframe . frame drop oldframe
将现有数据框oldname重命名为newname . frame rename oldname newname
仅将变量x1、x2和x3复制到名为subset1的数据框中 . frame put x1 x2 x3, into(subset1)
只将z > 50的观测值复制到名为subset2的新框中 . frame put if z > 50, into(subset2)
探索数据框 列出内存中的所有数据框,以及每个框中数据的标签和维度 . frames dir
描述内存中每一个框中的数据 . frames describe 切换数据框 将myframe设置为活动框,对myframe中的数据执行Stata命令,并再次将default设置为活动框 . frame change myframe . stata_command . stata_command . frame change default
使用frame前缀对myframe中的数据运行Stata命令 . frame myframe: one_stata_command
对myframe中的数据运行多个命令 . frame myframe { stata_commamd stata_command } 在内存中存储多个数据集可以支持您同时执行多个任务,处理彼此独立但相关的数据集,将结果从一个数据集导入到另一个数据集,等等。 使用独立但相关的数据集 你有两个相关文件persons.dta 和 counties.dta,这些人住在不同郡县。你可以将数据集加载到单独的框中,并将它们链接起来。
在default框中打开persons.dta . use persons
创建一个新的counties数据框并打开counties.dta . frame create counties . frame counties: use counties
使用变量countyid将活动框(default)中的观测值链接到郡县框中相应的观测值 . frlink m:1 countyid, frame(counties)
将记录各县收入中位数的变量med _ income从郡县框复制到活动框 . frget med_income, from(counties)
为变量med homesize创建别名,该变量记录每个郡县的房屋大小中位数,这样您就可以像在活动框中一样使用该变量。 . fralias add med_homesize, from(counties)
使用数据框让工作变得更简单 假设你有世界各地城市和国家的数据,并且您希望在不修改当前数据的情况下高效地分析德国的数据: . frame put if country==”Germany”, into(subset) . frame change subset . stata_commands . frame change default . frame drop subset
在另一个数据框中记录结果 用变量t和p创建一个名为results的新数据框 . frame create results t p
进行1000次模拟,绘制100个随机正态变量,将平均值与0进行t检验,并将t统计量和p值发布到结果框中 . forvalues i=1(1)1000 { 2. quitely set obs 100 3. quietly generate x = rnormal() 4. quietly ttest x=0 5. frame post results (r(t)) (r(p)) 6. drop _all 7. } 计算results框中p值小于0.05的观测值 . frame results: count p <= 0.05 北京天演融智软件有限公司(科学软件网)是Stata软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。 |