JavaScript 高级程序设计 - 变量、作用域和内存问题
基本类型和引用类型
ECMAScript 变量可能包含两种不同数据类型的值 :基本类型值和引用类型值。基本类型值指的是简单的数据段,而引用数据类型指那些可能由多个值构成的对象。
在将一个值赋值给变量时,解析器必须确定这个值时基本数据类型还是引用类型值。基本类型的值是按值访问的,因为可以操作保存在变量中的实际的值。
引用类型的值时保存在内存中的对象,JavaScript 不允许直接访问内存中的位置,即不能直接操作对象的内存空间。在操作对象时,实际上是操作对象的引用而不是实际的对象(当复制保存着对象的某个变量时,操作的是对象的引用;但在为对象添加属性时,操作的是实际的对象)。
在很多其它语言中,字符串以对象的形式来表示,因此被认为是引用类型的。
动态的属性
对于引用类型的值,我们可以为其添加属性和方法,也可以改变和删除属性和方法 :
1 | var aObject = new Object(); |
复制变量值
除了保存的方式不同之外,在从一个变量向另一个变量复制基本类型值和引用类型值时,也存在不同。
如果从一个变量向另一个变量复制基本类型值,会在变量对象上创建一个新值,然后把该值复制到为新变量分配的位置上。
当从一个变量向另一个变量复制引用类型值时,同样也会将存储在变量对象的值复制一份放到为新变量分配的空间中。不同的是,这个值的副本实际上是一个指针,而这个指针指向存储在堆中的一个对象。复制操作结束后,两个变量实际上将引用同一个对象。
传递参数
ECMAScript 中函数的参数都是按值传递的。基本类型值得传递如同基本类型变量的复制一样,而引用类型值得传递,则如同引用类型变量的复制一样。
在向参数传递基本类型的值时,被传递的值会被复制给一个局部变量(即命名参数)。在向参数传递引用类型的值时,会把这个值在内存中的地址复制给一个局部变量,因此这个局部变量的变化会反映在函数的外部。
检测类型
基本类型检测的最佳工具是 typeof 操作符。但在检测引用类型的值时,这个操作符的用处不大,我们并不是想知道某个值是对象,而是想知道它是什么类型的对象。
使用 instanceof 操作符来确定实例是否是给定的引用类型 :
1 | result = variable instanceof constructor |
所有引用类型的值都是 Object 的实例。因此,在检测一个引用类型值和 Object 构造函数时,instanceof 操作符始终会返回 true 。当然,如果使用 instanceof 操作符检测基本类型的值,则该操作符始终会返回 false , 因为基本类型不是对象。
执行环境及作用域
执行环境是 JavaScript 中最为重要的一个概念。执行环境定义了变量或函数有权访问的其它数据,决定了它们各自的行为。每个执行环境都有一个与之关联的变量对象,环境中定义的所有变量和函数都保存在这个对象中。
全局执行环境是最外围的一个执行环境。根据 ECMAScript 实现所在的宿主环境不同,表示执行环境的对象也不一样。在 Web 浏览器中,全局执行环境被认为是 window 对象。
某个执行环境中的所有代码执行完毕后,该环境被销毁,保存在其中的所有变量和函数定义也随之销毁(全局执行环境直到应用程序退出时,才会被销毁)。
每个函数都有自己的执行环境。当执行流进入一个函数时,函数的环境就会被推入一个环境栈中。而在函数执行之后,栈将其环境弹出,把控制权返回给之前的执行环境。
当代码在一个环境中执行时,会创建变量对象的一个作用域链。作用域链的用途是保证对执行环境有权访问的所有变量和函数的有序访问。作用域链的前端,始终都是当前执行代码所在环境的变量对象。如果这个环境是函数,则将其活动对象作为变量对象。活动对象在最开始时只包含一个变量,即 arguments 对象。作用域链中的下一个变量对象来自包含环境,而再下一个变量对象则来自下一个包含环境。这样,一直延续到全局执行环境;全局执行环境的变量对象始终都是作用域链中的最后一个对象。
标识符解析是沿着作用域链一级一级地搜索标识符的过程。搜索过程始终从作用域链的前端开始,然后逐级地向后回溯,直到找到标识符为止(如果找不到标识符,通常会导致错误发生)。
延长作用域链
虽然执行环境的类型总共只有两种 :全局和局部,但是还有其它办法来延长作用域链。这是因为有些语句可以在作用域链的前端临时增加一个变量对象,该变量对象会在代码执行后被移除。
在两种情况下会发生这种现象 :
try-catch语句的catch块with语句
这两个语句都会在作用域链的前端添加一个变量对象。对 with 语句来或,会将指定的对象添加到作用域链中。对于 catch 语句来说,会创建一个新的变量对象,其中包含的是被抛出的错误对象的声明。
没有块级作用域
JavaScript 没有块级作用域经常会导致理解上的困惑。在其它类 C 语言中,由花括号封闭起来的代码块都有自己的作用域,因而支持根据条件来定义变量。
1 | if (true) { |
上面的例子中,在 if 语句中定义了变量 color ,它被添加到当前的执行环境,所以在 if 语句结束后还能够被访问。
在使用 for 语句时尤其要牢记这一差异 :由 for 语句创建的循环变量即使 for 循环执行结束后,也依旧会存在于循环外部的执行环境中。
声明变量
使用关键字 var 声明的变量会自动被添加到最接近的环境中。在函数内部,最接近的环境就是函数的局部环境;在 with 语句中,最接近的环境是环境函数。如果初始化变量时没有使用 var 声明,该变量会自动被添加到全局环境。
在编写 JavaScript 代码的过程中,不声明而直接初始化变量是一个常见的错误做法。
查询标识符
当在某个环境中为了读取或写入而引用一个标识符时,必须通过搜索来确定该标识符实际代表什么。搜索过程从作用域链的前端开始,向上逐级查询与给定名字匹配的标识符。如果在局部环境中找到了该标识符,搜索过程停止,变量就绪。如果在局部环境中没有找到该变量名,则继续沿作用域链向上搜索。搜索过程将一直追溯到全局环境的变量对象。如果在全局环境中也咩有找到这个标识符,则意味着该变量尚未声明。
变量查询也不是没有代价的。很明显,访问局部变量要比访问全局变量更快。
垃圾收集
JavaScript 具有自动垃圾收集机制,也就是说,执行环境会负责管理代码执行过程中使用的内存。在 JavaScript 中,所需内存的分配和无用内存的回收完全实现了自动管理 :找出那些不再继续使用的变量,然后释放其占用的内存。为此,垃圾收集器会按照固定的时间间隔,周期性的执行这一操作。
局部变量只在函数执行的过程中存在。在这个过程中,会为局部变量在栈或堆上分配相应的空间,以便存储它们的值。然后在函数中使用这些变量,直到函数执行结束。此时,局部变量就没有存在的必要了,因此可以释放它们的内存以供将来使用。在这种情况下,很容易判断变量是否还有存在的必要;但并非所有情况下都能这么容易得出结论。垃圾收集器必须跟踪哪个变量有用哪个变量没用,对于不再有用的变量打上标记,以备将来回收其占用的内存。
标记清除
JavaScript 中最常用的垃圾收集方式是标记清除。当变量进入环境时,就将这个变量标记为 “进入环境” 。从逻辑上讲,永远不能释放进入环境的变量所占用的内存,因为只要执行流进入相应的环境,就可能会用到它们。而当变量离开环境时,则将其标记为 “离开环境” 。
标记变量的方式很多,它并不重要,关键在于才去什么策略。
垃圾收集器在运行的时候回给存储在内存中的所有变量都加上标记。然后,它会去掉环境中的变量以及被环境中的变量引用的变量的标记。而在此之后再被加上标记的变量被视为准备删除的变量,原因是环境中的变量已经无法访问到这些变量了。最后,垃圾收集器完成内存清除工作,销毁那些带标记的值并回收它们所占用的内存空间。
性能问题
垃圾收集器是周期性运行的,而且如果为变量分配的内存数量很可观,那么回收工作量也是相当大的。这种情况下,确定垃圾收集的时间间隔是一个非常重要的问题。
管理内存
使用具备垃圾收集机制的语言编写程序,开发人员一般不必操心内存管理问题。但是,JavaScript 在进行内存管理及垃圾收集时面临的最主要问题是分配给 Web 浏览器的可用内存数量通常比分配桌面应用程序的少。这样做的目的是防止运行 JavaScript 的网页耗尽全部系统内存而导致系统崩溃。内存限制不仅会影响给变量分配内存,同时还会影响调用栈以及在一个线程中能够同时执行的语句数量。
因此,确保占用最少的内存可以让页面获得更好的性能。而优化内存占用的最佳方式,就是为执行中的代码只保存必要的数据。一旦数据不再有用,最好通过将其设置为 null 来释放其引用。这一做法适用于大多数全局变量和全局对象的属性。
解除一个值的应用的真正作用是让值脱离执行环境,以便垃圾收集器下次运行时将其回收。
JavaScript 高级程序设计 - 变量、作用域和内存问题
https://cocoalei.github.io/blogs/2017/05/17/javascript-advanced-variable-scope/