基于R语言赋值符号的区别说明

R语言赋值可以用=或

R语言赋值可以用=或<-,一般都建议使用<-,那你知道这两个之间的区间吗?那你有没有见过‘<-'和‘='这种赋值方法吗?今天就来和大家聊聊这基本的赋值符号都有哪些区别。

首先我们来看看符号的优先级,和java,c这些编程语言的优先级类似。下面这些都取自R帮助文档,输入?Syntax即可查看,它是根据优先级从高到低排列的。

:: :::    access variables in a namespace
$ @    component / slot extraction
[ [[    indexing
^    exponentiation (right to left)
- +    unary minus and plus
:    sequence operator
%any%    special operators (including %% and %/%)
* /    multiply, divide
+ -    (binary) add, subtract
< > <= >= == !=    ordering and comparison
!    negation
& &&    and
| ||    or
~    as in formulae
-> ->>    rightwards assignment
<- <<-    assignment (right to left)
=    assignment (right to left)
?    help (unary and binary)

我们可以看到<-的优先级比=高,这一点我们在使用时一定要注意到。

现在来举几个简单例子看看

> median(x =1:10)
[1] 5.5> x
错误: 找不到对象'x'
> median(x <-1:10)
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

现在来看另外一个例子

> rm(x)
> median((x=1:10))
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

那这又是为什么不报错了呢?那是因为括号的优先级更高,它相当于先给x赋值,再传入到median,与下面例子等价。

> rm(x)
> x=1:10 #此时等价于x<-1:10
> median(x)
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

为什么此时输入x并没有报错而前面却报错?因为在这种情况下,x被定义在用户的当前工作空间,所以在这个使用median之后x还是存在的。

总结一下:

这说明使用这两种方法赋值的变量是存在不同的空间或作用域。= 赋值对象存在赋值时所在的空间,而<- 赋值对象存在当前整个空间。

看起来有点晦涩,现在来仔细说说这两个的区别:

(1) 赋值时所在的空间,比如median(x =1:10),x的值仅存在median函数内部空间,在median函数外面访问不到x,所以前面程序中报错:错误: 找不到对象'x'。

(2) 当前整个空间,比如median(x <-1:10),它其实就是median(x=x <-1:10),<-优先级高,先执行x <-1:10,再赋值给x,只不过这里省略了,因为一般传参数时,我们都不写参数名。x存在于当前空间,所以x可以访问到。

如果我们定义一个函数,函数中变量用<-赋值,那么在函数外面还能访问到吗?

> rm(x)
> test<-function(){
+ x<-1
+ }
>test()
> x

错误: 找不到对象'x'

当然是不能的,因为x定义在test函数内部,仅存在test函数的空间里面,所以在该函数外面根本访问不到x。如果想访问到x,除了returen,也不是没有其他办法的。

现在来看看另外一种赋值方法,估计很少人见过,了解之后有助于我们理解赋值过程。

> '<-'(x,5) #等价于x<-5
> x
[1] 5
> '='(x,6)#等价于x=6
> x
[1] 6

简单了解之后,来做几个测试

一般情况下,将=和<-两个赋值符号同时使用就会出现一些错误,比如下面这例子,如果了解'<-'之后,那么就很容易理解。

> x<-y<-10 #等价于'<-'(x,'<-'(y,10))
> x
[1] 10
> y
[1] 10
> x <- y = 12
Error in x <- y = 12 : 没有"<-<-"这