Biến, kiểu dữ liệu và toán tử

Kiểu động

JavaScript là một ngôn ngữ định kiểu yếu hay động. Điều đó nghĩa là không cần phải khai báo kiểu của các biến trước khi dùng. Kiểu sẽ được xác định tự động trong khi chương trình được thực thi. Điều đó cũng có nghĩa là một biến có thể chứa giá trị của các kiểu dữ liệu khác nhau:

let foo = 42;    // foo là một số
foo     = 'bar'; // foo bây giờ là một chuỗi
foo     = true;  // foo bây giờ là một boolean

Các kiểu Dữ liệu và kiểu Cấu trúc

Tiêu chuẩn ECMAScript mới nhất xác định chín kiểu:

  • Sáu kiểu Dữ liệu sơ khai (primitive), có thể kiểm tra với toán tử typeof:
  • Kiểu nulltypeof instance === "object". Một kiểu sơ khai mà giá trị của nó có thêm một vai trò đặc biệt: nếu object không kế thừa từ đối tượng nào khác, null sẽ được hiển thị ở cuối chuỗi Prototype
  • Objecttypeof instance === "object". Kiểu phi dữ liệu nhưng có cấu trúc cho các đối tượng được khởi tạo và được dùng như cấu trúc dữ liệu: new Object, new Array, new Map, new Set, new WeakMap, new WeakSet, new Date hay bất kỳ đối tượng nào được tạo ra với từ khóa new.
  • Kiểu phi dữ liệu Function, mặc dù khi gọi với typeof nó có nhãn riêng: typeof instance === "function". Giá trị trả về từ typeof này là một nhãn đặc biệt cho các function, cho dù constructor của Function phát sinh từ Object constructor.

Lưu ý: vai trò có giá trị duy nhất của toán tử typeof là dùng để kiểm tra các kiểu Dữ liệu (sơ khai). Nếu bạn muốn kiểm tra các kiểu Cấu trúc phát sinh từ Object, typeof sẽ chẳng có ích gì vì nó sẽ luôn trả về "object". Cách đúng đắn để kiểm tra một Object thuộc loại nào là dùng từ khóa instanceof. Tuy nhiên, ngay cả với cách này cũng có một vài ngoại lệ.

Giá trị sơ khai

Tất cả các kiểu trừ đối tượng đều được xác định giá trị bất biến (giá trị không có khả năng thay đổi). Ví dụ (và không như ngôn ngữ C), các chuỗi là bất biến. Ta gọi chúng là “giá trị sơ khai” (“primitive”).

Kiểu boolean

Kiểu boolean mang hai giá trị logic là: true, và false. Xem thêm Boolean và Boolean.

Kiểu null

Có duy nhất một giá trị: null. Xem null và Null để biết thêm chi tiết.

Kiểu undefined

Một biến chưa được gán giá trị có giá trị undefined. Xem undefined và Undefined để biết thêm chi tiết.

Kiểu số Number

Theo tiêu chuẩn ECMAScript, chỉ có duy nhất một kiểu số: the double-precision 64-bit binary format IEEE 754 value (có giá trị từ -(253 -1) đến 253 -1). Không có kiểu số nguyên. Ngoài việc có thể chứa giá trị dấu phẩy động, kiểu số có ba giá trị biểu tượng: +Infinity-Infinity, and NaN (not-a-number).

Để kiểm tra lớn hơn hay nhỏ hơn +/-Infinity, bạn có thể xem Number.MAX_VALUE hoặc Number.MIN_VALUE và bất đầu từ ECMAScript 6, bạn cũng có thể kiểm tra một số có nằm trong khoảng double-precision floating-point bằng cách dùng Number.isSafeInteger() cũng như Number.MAX_SAFE_INTEGER và Number.MIN_SAFE_INTEGER. Ngoài phạm vi này, một số trong Javascript không còn an toàn nữa.

Có một số nguyên duy nhất có hai đại diện: 0 được đại diện bởi -0 và +0. (“0” là một bí danh của +0). Trong thực tế, điều này hầu như không có tác động. Ví dụ +0 === -0 là true. Tuy nhiên, có thể nhân thấy điều này khi chia một số cho không:

> 42 / +0
Infinity
> 42 / -0
-Infinity

Mặc dù một số thường chỉ đại diện cho giá trị của nó, JavaScript cung cấp một vài toán tử nhị phân. Chúng có thể được sử dụng như một chuỗi boolean bằng cách dùng bit masking. Điều này thường được xem như là một cách tệ, tuy nhiên, JavaScript không cung cấp bất kỳ phương tiện nào khác để trình bày một tập hợp các boolean (như một mảng các boolean hay một đối tượng với các thuộc tính boolean). Bit masking cũng có xu hướng làm mã khó đọc, hiểu, và duy trì hơn. Nó có thể cấn thiết trong một môi trường rất hạn chế, giống như khi cố gắng để đối phó với hạn chế lưu trữ lưu trữ cục bộ hoặc trong trường hợp nặng khi mỗi chút so với đếm mạng. Kỹ thuật này chỉ nên được xem xét khi nó là biện pháp cuối cùng có thể được thực hiện để tối ưu hóa kích thước.

Kiểu số BigInt

Kiểu BigInt là một kiểu giá trị số sơ khai trong JavaScript, đại diện cho các giá trị số nguyên với độ chính xác (precision) bất kỳ. Với BigInt, bạn có thể lưu và tính toán trên các số nguyên lớn mà nó có thể lớn hơn cả giới hạn an toàn của kiểu Number.

Một số BigInt được tạo ra bằng cách thêm n vào cuối giá trị literal số nguyên hoặc bằng cách sử dụng constructor.

Bạn có thể lấy giá trị nguyên an toàn lớn nhất của kiểu Number bằng cách sử dụng constant Number.MAX_SAFE_INTEGER. Với sự ra đời của kiểu BigInt, giờ đây bạn có thể tính toán với những con số còn lớn hơn Number.MAX_SAFE_INTEGER.

Trong ví dụ sau, khi tăng dần giá trị Number.MAX_SAFE_INTEGER, bạn vẫn nhận được kết qua như mong muốn với BigInt:

> const x = 2n ** 53n;
9007199254740992n
> const y = x + 1n; 
9007199254740993n

Bạn có thể sử dụng các toán tử +*-**, và % với BigInt như với Number. Một số BigInt không hoàn toàn bằng (===) một số Number, nhưng có thể bằng khi ép kiểu (==).

Số BigInt hành xử giống với Number khi được chuyển đổi kiểu về Booleanif||&&Boolean!.

Số BigInt không thể dùng chung với số Number để tính toán. Khi đó, lỗi TypeError sẽ xảy ra.

Kiểu chuỗi

Kiểu chuỗi được dùng để biểu diễn dữ liệu dạng văn bản. Nó là một dãy “các phần tử” số nguyên 16-bit. Mỗi phần tử có một vị trí trong chuỗi. Phần tử đầu tiên có chỉ số 0, tiếp theo là 1, … . Độ dài của chuỗi là số phần tử của nó.

Không giống với những ngôn ngữ như C, Chuỗi trong Javascript là bất biến. Nghĩa là một khi chuỗi được tạo thì không thể chỉnh sửa. Tuy nhiên, vẫn có thể tạo một chuỗi mới dựa vào các thao tác trên chuỗi cũ. Ví dụ:

  • Tạo một chuỗi con của chuỗi ban đầu bằng cách ghép từng ký tự hoặc dùng String.substr().
  • Nối hai chuỗi bằng toán tử (+) hoặc hàm String.concat().

Cẩn thận với việc “lưu mọi thứ bằng chuỗi” trong code của bạn!

Chuỗi có thể được dùng để biểu diễn dữ liệu với cấu trúc phức tạp. Điều này mang tới một vài lợi ích ngắn hạn:

  • Rất dễ để xây dựng một chuỗi bằng phép nối.
  • Dễ debug (những gì bạn thấy khi in luôn là tất cả những thứ có trong chuỗi).
  • Chuỗi là mẫu số chung của rất nhiều API (nhậplocal storage values, XMLHttpRequest phản hồi khi dùng responseText, …) và điều này có thể khiến việc chỉ làm việc với chuỗi được yêu thích.

Chuỗi có thể biểu diễn bất kì kiểu dữ liệu nào. Những đây không được xem là một ý hay. Ví dụ, đối với một separator, có thể bắt trước một chuỗi (trong khi một mảng sẽ thích hợp hơn). Thật không may, khi separator được dùng trong một “danh sách” các phần tử, danh sách bị hỏng. Một escape character có thể được chọn, ….. Tất cả những điều này yêu cầu một quy ước và tạo ra gánh nặng bảo trì không cần thiết.

Chỉ nên dùng chuỗi để lưu trữ dữ liệu văn bản. Khi biểu diễn một cấu trúc phức tạp, phân tích chuỗi thành các cấu trúc dữ liệu với mức trừu tưỡng cao hơn.

Kiểu Symbol

Kiểu Symbol là một kiểu mới trong Javascript tiêu chuẩn ECMAScript 6. Mỗi Symbol là một giá trị sơ khai đơn nhất và bất biến và có thể được dùng như một khóa của một Object (xem bên dưới). Trên một số ngôn ngữ lập trình, Symbol còn được gọi là “atom” (nguyên tử). Ta cũng có thể so sánh với các enumeration (enum) trong C. Xem Symbol và Symbol để biết thêm chi tiết.

Đối tượng

Trong khoa học máy tính, một đối tượng là một giá trị trong bộ nhớ được tham chiếu bởi một định danh.

Thuộc tính

Trong Javascript, đối tượng có thể được xem là tập hợp các thuộc tính. Với object literal syntax, một tập hợp hữu hạn các thuộc tính được khởi tạo; sau đó thuộc tính có thể được thêm hoặc loại bỏ. Giá trị thuộc tính thuộc bất kỳ kiểu dữ liệu, bao gồm những đối tượng khác (kể cả chính đối tượng đó), điều này cho phép xây những những cấu trúc dữ liệu phức tạp. Thuộc định được định danh bằng khóa. Một khóa phải là một chuỗi hoặc một Symbol.

Có hai loại thuộc tính với các đặc điểm nhất định: Chứa dữ liệu và accessor.

Thuộc tính chứa dữ liệu

Liên kết một khóa với một giá trị có các đặc điểm sau:

Các đặc điểm của thuộc tính chứa dữ liệu

Đặc điểmKiểuMô tảGiá trị mặc định
[[Value]]Bất kỳGiá trị của thuộc tính.undefined
[[Writable]]BooleanNếu là false, thuộc tính [[Value]] không thể thay đổi.false
[[Enumerable]]BooleanNếu là true, khóa của giá trị có thể được liệt kê bằng vòng lặp for…in.false
[[Configurable]]BooleanNếu là false, thuộc tính không thể bị xóa cũng như không thể thay đổi các đặc điểm của nó.false

Accessor

Liên kết một khóa với một hoặc hai hàm accessor (get và/hoặc set):

Đặc điểmLoạiMô tảGiá trị mặc định
[[Get]]Hàm hoặc undefinedHàm được gọi không đối số và trả về giá trị mỗi khi có truy cập tới thuộc tính. Xem get.undefined
[[Set]]Hàm hoặc undefinedHàm được gọi với một đối số mỗi khi thuộc tính được gán một giá trị. Xem set.undefined
[[Enumerable]]BooleanNếu là true, khóa của giá trị có thể được liệt kê bằng vòng lặp for…in.false
[[Configurable]]BooleanNếu là false, thuộc tính không thể bị xóa cũng như không thể thay đổi các đặc điểm của nó.false

Đối tượng “thông thường” và hàm

Mội đối tượng là một bảng các khóa và giá trị. Khóa là một chuỗi và giá trị có thể là bất kỳ thứ gì. Điều này khiến đối tượng phù hợp với hashmaps.

Hàm là một đối tượng với khả năng có thể gọi.

Đối tượng Date

Để biểu diễn một thời điểm hay ngày tháng, Lựa chọn tốt nhất là sử dụng Date.

Tập hợp có thứ tự: Mảng và mảng đã định kiểu

Mảng là một đối tượng có một quan hệ đặc biệt giữa các thuộc tính có khóa nguyên và thuộc tính ‘length’. Thêm vào đó, mảng thừa kế các thuộc tính của Array.prototype cung cấp một số ít các hàm xeur lý danh sách. Ví dụ, indexOf (tìm giá trị trên một mảng) hay push (thêm một phần tử vào cuối danh sach), …. Điều này biến mảng trở thành ứng cử viên hoàn hào cho danh sách hoặc tập hợp.

Mảng đã định kiểu là loại mới trong ECMAScript 6 và biểu diễn dữ liệu nhị phân như một mảng. Bảng sau đây giúp bạn so sánh với kiểu dữ liệu trong C:

TypedArray objects

TypeValue RangeSize in bytesDescriptionWeb IDL typeEquivalent C type
Int8Array-128 to 12718-bit two’s complement signed integerbyteint8_t
Uint8Array0 to 25518-bit unsigned integeroctetuint8_t
Uint8ClampedArray0 to 25518-bit unsigned integer (clamped)octetuint8_t
Int16Array-32768 to 32767216-bit two’s complement signed integershortint16_t
Uint16Array0 to 65535216-bit unsigned integerunsigned shortuint16_t
Int32Array-2147483648 to 2147483647432-bit two’s complement signed integerlongint32_t
Uint32Array0 to 4294967295432-bit unsigned integerunsigned longuint32_t
Float32Array1.2×10-38 to 3.4×1038432-bit IEEE floating point number (7 significant digits e.g., 1.1234567)unrestricted floatfloat
Float64Array5.0×10-324 to 1.8×10308864-bit IEEE floating point number (16 significant digits e.g., 1.123...15)unrestricted doubledouble
BigInt64Array-263 to 263-1864-bit two’s complement signed integerbigintint64_t (signed long long)
BigUint64Array0 to 264-1864-bit unsigned integerbigintuint64_t (unsigned long long)

Keyed collections: Maps, Sets, WeakMaps, WeakSets

These data structures take object references as keys and are introduced in ECMAScript Edition 6. Set and WeakSet represent a set of objects, while Map and WeakMap associate a value to an object. The difference between Maps and WeakMaps is that in the former, object keys can be enumerated over. This allows garbage collection optimizations in the latter case.

One could implement Maps and Sets in pure ECMAScript 5. However, since objects cannot be compared (in the sense of “less than” for instance), look-up performance would necessarily be linear. Native implementations of them (including WeakMaps) can have look-up performance that is approximately logarithmic to constant time.

Usually, to bind data to a DOM node, one could set properties directly on the object or use data-* attributes. This has the downside that the data is available to any script running in the same context. Maps and WeakMaps make it easy to privately bind data to an object.

Structured data: JSON

JSON (JavaScript Object Notation) is a lightweight data-interchange format, derived from JavaScript but used by many programming languages. JSON builds universal data structures. See JSON and JSON for more details.

More objects in the standard library

JavaScript has a standard library of built-in objects. Please have a look at the reference to find out about more objects.

Determining types using the typeof operator

The typeof operator can help you to find the type of your variable. Please read the reference page for more details and edge cases.

Specifications

SpecificationStatusComment
ECMAScript 1st Edition (ECMA-262)StandardInitial definition.
ECMAScript 5.1 (ECMA-262)
The definition of ‘Types’ in that specification.
Standard
ECMAScript 2015 (6th Edition, ECMA-262)
The definition of ‘ECMAScript Data Types and Values’ in that specification.
Standar

Leave a reply:

Your email address will not be published.

Site Footer

Sliding Sidebar

Facebook