\[
\int x^2 dx = \frac{x^3}{3} + C
\]
\( E = mc^2 \)
\[
\frac{d}{dx} \left( x^2 \right) = 2x
\]
\[
x = \frac{-b \pm \sqrt{b^2 – 4ac}}{2a}
\]
\[
\frac{d}{dx} \left( x^2 \right) = 2x
\]
\[
\int x^2 \,dx = \frac{x^3}{3} + C
\]
\[
E = mc^2
\]
\[
\frac{d}{dx} \left( x^2 \right) = 2x
\]
\[
x = \frac{-b \pm \sqrt{b^2 – 4ac}}{2a}
\]
\[
\frac{d}{dx} \left( x^2 \right) = 2x
\]
\[
\text{clr}(x) = (\text{clr}_1, \text{clr}_2, \dots, \text{clr}_D)
= \log \left( \frac{x_j}{(x_1^{1/D} x_2^{1/D} \dots x_D^{1/D})} \right)
= \log \left( \frac{x_j}{\sqrt[D]{x_1 x_2 \dots x_D}} \right) \quad (2)
\]
\[
\text{trong đó: } j = 1, \dots, D
\]
### 3.2. Lựa chọn biến số
Dựa theo mục tiêu nghiên cứu đã đề ra, các chỉ số (tỷ số) tài chính liên quan đến khả năng thanh toán và các tỷ lệ thành phần trong phân tích DuPont được lựa chọn. Như đã trình bày ở phần cơ sở lý thuyết, các dữ liệu thông tin tài chính được thu thập dựa theo các yếu tố có tác động đến việc phân loại doanh nghiệp, bao gồm tính thanh khoản, cấu trúc nợ và khả năng sinh lời. Các chỉ số tài chính được tính toán là các chỉ số thông dụng đã được sử dụng trong rất nhiều nghiên cứu để đại diện cho các nhóm đặc điểm này (du Jardin và c.s., 2019; Veganzones & Severin, 2021).
Các tỷ lệ này được tính từ dữ liệu thông tin kế toán thu thập được. Đầu tiên, các biến cho thông tin kế toán được gán thành các biến \( x_j \), cụ thể như sau:
\[
x_1 = \text{Tài sản dài hạn} = \text{Tổng tài sản} – \text{Tài sản ngắn hạn}
\]
\[
x_2 = \text{Tài sản ngắn hạn}
\]
\[
x_3 = \text{Nợ dài hạn}
\]
\[
x_4 = \text{Nợ ngắn hạn}
\]
\[
x_5 = \text{Doanh thu}
\]
\[
x_6 = \text{Chi phí} = \text{Doanh thu} – \text{Lợi nhuận ròng}
\]
Tiếp theo đó, các chỉ số tài chính tiêu chuẩn sẽ được tính từ các biến \( x \) được xác định ở trên. Bảng dưới đây cung cấp giải thích cho ý nghĩa của từng chỉ số:
\[
x_1 = \text{Tài sản dài hạn} = \text{Tổng tài sản} – \text{Tài sản ngắn hạn}
\]
\[
x_2 = \text{Tài sản ngắn hạn}
\]
\[
x_3 = \text{Nợ dài hạn}
\]
\[
x_4 = \text{Nợ ngắn hạn}
\]
\[
x_5 = \text{Doanh thu}
\]
\[
x_6 = \text{Chi phí} = \text{Doanh thu} – \text{Lợi nhuận ròng}
\]
Tiếp theo đó, các chỉ số tài chính tiêu chuẩn sẽ được tính từ các biến \( x \) được xác định ở trên. Bảng dưới đây cung cấp giải thích cho ý nghĩa của từng chỉ số:
% Thêm bảng nếu cần
### 3.3.2. Chuyển đổi dữ liệu đa hợp sử dụng phép chuyển đổi logarit cộng tính (Additive log-ratios) và logarit trung tâm (Centered log-ratios) có trọng số.
Do các thành phần trong vector đa hợp luôn có tổng bằng 1 (hoặc 100%), việc phân tích trực tiếp các thành phần có thể gây ra phụ thuộc giả. Để thuận tiện hơn trong việc xử lý và phân tích dữ liệu, CoDA sử dụng các phép biến đổi logarit để xử lý vector đa hợp, như phương pháp đã được giới thiệu bởi Aitchison vào năm 1986. Trong nghiên cứu này, tỷ lệ logarit cộng tính (ALR) và tỷ lệ logarit trung tâm (CLR) được chọn để sử dụng. Sau khi thực hiện các phép chuyển đổi log-ratio, vector đa hợp ban đầu sẽ được đưa vào không gian Euclid mà ở đó các phương pháp thống kê thông thường (như hồi quy, phân cụm, PCA) có thể được áp dụng một cách chính xác và không tạo ra các mối phụ thuộc giả.
Đối với một tập hợp các \( D \) loại tài khoản kế toán thu được từ báo cáo tài chính (các chỉ số tài chính được gán là \( x_j \)), phép biến đổi ALR được biểu diễn như sau:
\[
\text{alr}(x) = (\text{alr}_1, \text{alr}_2, \dots, \text{alr}_{D-1}) = \left(\log \frac{x_1}{x_D}, \dots, \log \frac{x_{D-1}}{x_D} \right) \quad (1)
\]
Phép biến đổi logarit cộng tính (ALR) chuyển đổi các biểu diễn trong đơn hình (simplex) thành biểu diễn trong không gian vector thật. ALR chuyển đổi dữ liệu đa hợp bằng cách chọn một thành phần chuẩn và tính log-ratio giữa các thành phần còn lại với thành phần chuẩn này. Như đã thấy từ công thức biểu diễn, vector ALR sau phép biến đổi sẽ có \( D-1 \) phần tử.
Với một tập hợp gồm \( D \) loại tài khoản kế toán tương tự, phép biến đổi logarit trung tâm (CLR) có thể được biểu diễn như sau:
\[
\text{clr}(x) = (\text{clr}_1, \text{clr}_2, \dots, \text{clr}_D) = \log \left( \frac{x_j}{(x_1^{1/D} x_2^{1/D} \dots x_D^{1/D})} \right) = \log \left( \frac{x_j}{\sqrt[D]{x_1 x_2 \dots x_D}} \right) \quad (2)
\]
trong đó: \( j = 1, \dots, D \)
Tương tự như ALR, phép biến đổi CLR chuyển đổi biểu diễn đơn hình thành biểu diễn không gian vector. CLR chuyển đổi tất cả các thành phần trong vector đa hợp bằng cách so sánh với trung bình hình học của toàn bộ các thành phần. Vector CLR sau phép biến đổi sẽ có \( D \) phần tử. Sau khi biến đổi CLR, khoảng cách Euclid giữa hai vector trong không gian log-ratio phản ánh đúng sự khác biệt tương đối giữa các thành phần của hai vector đa hợp (hay còn gọi là khoảng cách Aitchison).
Với thuộc tính bảo toàn khoảng cách, CLR thường được ưu tiên sử dụng hơn ALR trong các phân tích phân cụm. Tuy nhiên, trong các ứng dụng thông thường của phân tích dữ liệu đa hợp, một số nhóm dữ liệu tài chính nhất định có giá trị thường thấp có thể bộc lộ ra giá trị phương sai CLR rất lớn, gây ảnh hưởng đáng kể đến kết quả phân loại (Egozcue & Pawlowsky-Glahn, 2016; Greenacre & Lewi, 2009; Jofre-Campuzano & Coenders, 2022). Điểm hạn chế này có thể được giải quyết bằng cách tính toán một biến thể có trọng số của phép biến đổi CLR, trong đó trọng số \( w_j \), với tổng tất cả trọng số bằng 1, tỷ lệ thuận với giá trị trung bình của \( x_j \):
\[
\text{wclr}_j = \sqrt{w_j} \cdot \log \left( \frac{x_j}{x_1^{w_1} x_2^{w_2} \dots x_D^{w_D}} \right) \quad (3)
\]
\[
\text{Cho dãy số } (u_n)_{n \geq 1}, \text{ xác định bởi: } u_1 = 3, \quad u_2 = 5 \text{ và}
\]
\[
u_{n+2} = u_{n+1} + 2u_n, \quad \forall n \geq 1.
\]
\[
\text{Khi đó, ta có: }
\]
\[
9u_{n+1}^2 + (-1)^{n+1} \cdot 2^{n+5} \text{ là một số chính phương,} \quad \forall n \geq 1.
\]