*
Science Vietnam

Phần mềm thống kê và phân tích số liệu là một trong những công cụ thiết yếu đối với các nhà thống kê ở nhiều lĩnh vực . Có rất nhiều phần mềm chuyên dụng, trong đó phải kể đến: phần mềm xử lý số liệu thống kê SAS, SPSS, STATA, R… Mỗi phần mềm có những đặc trưng, ưu điểm và nhược điểm riêng.

Bạn đang xem: Phần mềm xử lý số liệu


*
Lựa chọn phần mềm xử lý số liệu và thống kê phù hợp?
*
Phần mềm thống kê số liệu SAS
SAS là gì?

SAS là bộ chương trình mà nhiều người sử dụng có trình độ cao ưa thích bởi sức mạnh và khả năng lập trình của nó. Do SAS là một bộ chương trình mạnh như vậy nên khó học nhất. Để sử dụng SAS, ta phải viết chương trình để thao tác dữ liệu và thực hiện các phân tích dữ liệu của mình. Nếu chương trình mắc lỗi, cái khó là phải biết tìm lỗi ở đâu và cách sửa thế nào.

Ưu điểm:

– SAS rất mạnh trong lĩnh vực quản lý dữ liệu, cho phép người sử dụng thao tác dữ liệu hầu như với mọi cách có thể

– SAS có thể làm việc với nhiều file dữ liệu cùng một lúc; điều này giảm đi tính phức tạp trong chuẩn bị dữ liệu đối với những nhiệm vụ phân tích đòi hỏi phải làm việc với nhiều file dữ liệu cùng một lúc.

– SAS có thể quản lý những file dữ liệu khổng lồ lên đến 32.768 biến và số lượng bản ghi là rất lớn chỉ phụ thuộc vào kích cỡ của đĩa cứng.

– Đối với phân tích thống kê, sức mạnh lớn nhất của SAS có thể tìm thấy trong phân tích ANOVA, phân tích mô hình hỗn hợp và phân tích nhiều chiều.

– SAS có các công cụ vẽ đồ thị mạnh nhất (SAS/Graph) so với hai bộ chương trình còn lại.

Nhược điểm:

– Mất nhiều thời gian để học và hiểu được cách quản lý dữ liệu của SAS và nhiều nhiệm vụ quản lý phức tạp của nó lại được thực hiện bằng những lệnh đơn giản trong SPSS và STATA

– Yếu đối với hồi qui logistic kiểu thứ tự và kiểu phạm trù (vì các lệnh này là đặc biệt khó) và các phương pháp ước lượng mạnh.

– Nó cũng có hỗ trợ một ít cho phân tích dữ liệu theo lược đồ mẫu, nhưng lại hạn chế hơn so với STATA.

Phần mềm SPSS


*
Phần mềm thống kê số liệu SPSS
SPSS là gì?

SPSS là một bộ chương trình mà nhiều người sử dụng ưa thích do nó rất dễ sử dụng. SPSS có một giao diện giữa người và máy cho phép sử dụng các menu thả xuống để chọn các lệnh thực hiện. Khi thực hiện một phân tích chỉ đơn giản chọn thủ tục cần thiết và chọn các biến phân tích và bấm OK là có kết quả ngay trên màn hình để xem xét. SPSS cũng có một ngôn ngữ cú pháp có thể học bằng cách dán cú pháp lệnh vào cửa sổ cú pháp từ một lệnh vừa chọn và thực hiện, nhưng nói chung khá phức tạp và không trực giác.

Ưu điểm

– SPSS có một bộ soạn thảo dữ liệu tương tự như excel, bộ soạn thảo cho phép vào các dữ liệu và mô tả các thuộc tính của chúng, chính vì vậy SPSS khá dễ sử dụng.

– Sức mạnh lớn nhất của SPSS là lĩnh vực phân tích phương sai (SPSS cho phép thực hiện nhiều loại kiểm định tác động riêng biệt) và phân tích nhiều chiều (thí dụ phân tích phương sai nhiều chiều, phân tích nhân tố, phân tích nhóm tổ).

– SPSS có một giao diện giữa người và máy rất đơn giản để tạo ra các đồ thị và khi đã tạo được một đồ thị, nhờ giao diện này mà người sử dụng có thể tuỳ ý hiệu chỉnh đồ thị cũng như hoàn thiện chúng. Các đồ thị có chất lượng rất cao và có thể dán vào các tài liệu khác, thí dụ như Word hoặc Powerpoint.

Nhược điểm

– Cái yếu nhất của SPSS là khả năng xử lý đối với những vấn đề ước lượng phức tạp và do đó khó đưa ra được các ước lượng sai số đối với các ước lượng này.

– SPSS cũng không hỗ trợ các công cụ phân tích dữ liệu theo lược đồ mẫu.

– SPSS không có công cụ quản lý dữ liệu thật mạnh

– SPSS xử lý mỗi file dữ liệu ở một thời điểm và không phải là rất mạnh khi thực hiện các nhiệm vụ phân tích cần làm việc với nhiều file dữ liệu cùng một lúc. Các file dữ liệu có thể có đến 4096 biến và số lượng bản ghi chỉ bị giới hạn trong dung lượng của đĩa cứng.

– Ngôn ngữ cú pháp của SPSS phức tạp hơn so với STATA, nhưng lại có phần đơn giản hơn, ít mạnh hơn SAS.

Phần mềm STATA


*
Phần mềm thống kê dữ liệu STATA
STATA là gì?

STATA là một bộ chương trình mà nhiều người mới bắt đầu và sử dụng mạnh đều ưa thích vì nó vừa dễ học có nhiều khả năng. STATA sử dụng các lệnh trực tiếp, có thể vào mỗi lệnh ở một thời điểm để thực hiện (chế độ này được người mới bắt đầu ưa thích) hoặc có thể soạn thảo thành một chương trình bao gồm nhiều lệnh cho một nhiệm vụ và thực hiện cùng một lúc. Thậm chí nếu mắc lỗi trong chương trình thì có thể nhận biết và sửa chữa dễ dàng.

Ưu điểm

– Cho phép thực hiện các thao tác phức tạp về dữ liệu một cách dễ dàng.

– Sức mạnh lớn nhất của STATA là hồi qui (rất dễ sử dụng các công cụ đoán nhận hồi qui), hồi qui logistic (những bổ sung mới làm đơn giản hoá việc giải thích kết quả hồi qui logistic, còn hồi qui logistic thứ tự và hồi qui logistic phạm trù là rất dễ thực hiện).

– STATA cũng có nhiều phương pháp ước lượng mạnh rất dễ sử dụng, bao gồm cả hồi qui mạnh và hồi qui với sai số chuẩn mạnh, và nhiều lệnh ước lượng khác kèm theo sai số chuẩn mạnh.

– STATA cũng trội hơn về lĩnh vực phân tích dữ liệu theo lược đồ mẫu, cho khả năng áp dụng chúng trong phân tích số liệu điều tra bởi các công cụ hồi qui, hồi qui logistic, hồi qui poisson, hồi qui probit,…

– Các đồ thị STATA còn có chức năng bổ sung cho phân tích thống kê, thí dụ như có nhiều lệnh làm đơn giản hoá việc tạo ra các đồ thị chẩn đoán hồi qui.

– Cú pháp của các lệnh đồ thị là dễ sử dụng nhất trong số ba bộ chương trình và cũng là mạnh nhất. Các đồ thị STATA có chất lượng cao và chất lượng xuất bản cũng cao.

Nhược điểm

– STATA hoàn toàn không có khả năng quản lý dữ liệu mạnh như SAS, nhưng các lệnh quản lý dữ liệu của nó vẫn có nhiều sức mạnh, lại rất đơn giản.

– Tuy nhiên, mỗi thời điểm STATA chỉ làm việc được với một file dữ liệu, vì vậy những nhiệm vụ xử lý cần nhiều file dữ liệu cùng một lúc đối với STATA là phức tạp hơn.

– Điểm yếu nhất là khả năng phân tích phương sai và phân tích nhiều chiều truyền thống như phân tích phương sai nhiều chiều, phân tích nhóm tổ.

– Các đồ thị của STATA không thể hiệu đính bằng bộ hiệu đính đồ thị.

Phần mềm R


*
Phần mềm R
R là gì?

R là phần mềm (cũng gọi là ngôn ngữ lập trình R) để phân tích dữ liệu. Khác với các phần mềm trên R là một phần mềm hoàn toàn miễn phí. Tuy miễn phí, nhưng chức năng của R không thua kém các phần mềm thương mại. Tất cả những phương pháp, mô hình mà các phần mềm thương mại có thể làm được thì R cũng có thể làm được. R có lợi thế là khả năng phân tích biểu đồ tuyệt vời.

Ưu điểm

– R có lợi thế là khả năng phân tích biểu đồ tuyệt vời. Không một phần mềm nào có thể sánh với R về phần biểu đồ

– R gắn liền với giới học thuật, hầu hết những mô hình thống kê mới nhất đều được hỗ trợ bởi R.

– Chạy được trên nhiều hệ điều hành

– Số 1 trong các phần mềm miễn phí

Nhược điểm

– R có cái bất lợi là dùng lệnh chứ không dùng menu như Excel. Điều này có nghĩa là đối với người “lười biếng” thì sẽ thấy R bất tiện. Nhưng với người muốn nắm lấy những cơ chế căn bản của toán học, thì sẽ thích ngôn ngữ này ngay.

– Người dùng phải có hiểu biết cao về kinh tế lượng, thống kê và khả năng lập trình vì trong phân tích đòi hỏi người dùng phải dùng các mã code để thực hiện các bước ước lượng và kiểm định hay phân tích các vấn đề cần thiết trong dữ liệu.

Vậy nên chọn phần mềm xử lý số liệu thống kê nào?

Không nên quá đặt nặng việc sử dụng phần mềm nào mà nên quan tâm đến mục tiêu phân tích trước hết, như đã nói ở trên, các phần mềm chỉ là sự khác biệt và tiện lợi cũng như update nhanh hơn nhau thôi, do đó lựa chọn phần mềm nào phụ thuộc vào sự quen thuộc của người phân tích và khả năng hiểu rõ mô hình để thực hiện chính xác trong phần mềm.

Xử lý số liệu GNSS mà cụ thể là xử lý cạnh và bình sai lưới là hai công tác quan trọng trong công tác khảo sát địa hình với máy định vị GNSS. Phần mềm xử lý số liệu GNSS nào tốt, đang được người dùng ưu tiên lựa chọn hiện nay? Hãy cùng Đất Hợp tìm hiểu chi tiết qua bài viết dưới đây.


Hai nhóm phần mềm xử lý số liệu GNSS được biết đến

Tùy theo chức năng và khả năng ứng dụng mà phần mềm xử lý số liệu GNSS được phân thành hai nhóm chính:

– Nhóm phần mềm xử lý số liệu GNSS thông dụng

Các phần mềm thông dụng được các nhà sản xuất máy thu GNSS chế tạo và chuyển giao kèm theo máy thu cho người sử dụng, phục vụ cho công tác xử lý số liệu đo GNSS. Thông thường, phần mềm của hãng nào sẽ làm việc tương thích với loại máy thu của hãng đó.

Tuy nhiên, để đáp ứng nhu cầu sử dụng của người dùng, tất cả phần mềm xử lý số liệu GNSS hiện nay đều chấp nhận khuôn dạng dữ liệu RINEX, do đó có thể sử dụng chung cho nhiều loại model máy thu khác nhau (của cùng một hãng hoặc nhiều hãng) để giải quyết các nhiệm vụ trắc địa.

– Nhóm phần mềm xử lý số liệu GNSS chuyên dụng

Các phần mềm chuyên dụng được các tổ chức khoa học, các trường đại học hay viện nghiên cứu… thành lập, phục vụ cho các mục đích nghiên cứu khoa học, sử dụng để xử lý số liệu GNSS độ chính xác cao. Ví dụ như: Phần mềm GAMIT-GLOBK của Trường Đại Học Công Nghệ Massachusetts (MIT) và Quỹ khoa học quốc gia Mỹ (NSF); phần mềm BERNESE của Viện Thiên văn, Đại học Bern Thụy Sỹ (AIUB) hay phần mềm GIPSY-OASIS của Cơ quan không gian vũ trụ Mỹ (NASA)…

Trong lĩnh vực Trắc địa tại Việt Nam, chủ yếu sử dụng các phần mềm xử lý số liệu GNSS thông dụng được chuyển giao cho người dùng kèm theo máy như:

Hãng Trimble (Mỹ): Trimble Business Center (TBC).Hãng Topcon (Nhật Bản): Top
SURV.Hãng Leica (Thụy Sỹ): Leica Geo Office (LGO).Hãng Magellan: GNSS Solutions, GNSS Studio Office.

Phần mềm xử lý số liệu GNSS nào tốt?

Hiện nay tại Việt Nam, Trimble là một trong những thương hiệu máy Trắc địa cao cấp được người dùng ưu tiên lựa chọn bởi độ chính xác, độ bền và độ ổn định mà nó mang lại.

Các giải pháp về GNSS là những giải pháp chiến lược phát triển của Trimble, luôn được hãng này đầu tư công nghệ công nghệ mới, để nâng cấp dòng sản phẩm nhằm đáp ứng nhu cầu ngày càng tăng của người dùng, trong đó phải kể đến hai dòng sản phẩm GNSS mới nhất là: Trimble R12 và Trimble R12i.

Kèm với đó, để hoàn thiện giải pháp GNSS của mình, Trimble cũng cung cấp thêm các phần mềm nhằm xử lý số liệu GNSS hiệu quả, giúp người dùng hoàn tất quy trình làm việc của mình chỉ trong một giải pháp, đó là Trimble Business Center.

*

Hình 1. Phần mềm Trimble Business Center.

– Thông tin về phần mềm

Trimble Business Center được gọi là phần mềm đa tính năng trong một của Trimble. Nó không chỉ có khả năng xử lý số liệu GNSS mà còn được sử dụng để xử lý các dữ liệu từ máy thủy bình, máy toàn đạc, scan 3D và xử lý cả dữ liệu từ các thiết bị bay không người lái (UAV)…

Trimble Business Center có hai phiên bản: Survey Standard (phiên bản chuẩn) và Survey Advanced (phiên bản nâng cao).

Survey Standard (phiên bản chuẩn): Sử dụng để xử lý dữ liệu đó ở một tần số L1 của GPS, cung cấp công cụ xử lý cạnh và bình sai lưới cơ bản.Survey Advanced (phiên bản nâng cao): Dùng để xử lý số liệu đó 2 tần số L1 và L2 của GPS và GLONASS, cho phép xử lý cạnh và lưới nâng cao.

*

Hình 2. Phần mềm Trimble Business Center phiên bản Survey Advanced.

– Tính năng nổi bật của phần mềm xử lý số liệu GNSS

Phần mềm xử lý số liệu Trimble Business Center (TBC) có khả năng xử lý số liệu, tính toán, bình sai lưới GPS từ các máy thu GNSS của Trimble và các máy thu khác ở dạng RINEX.

Xử lý Vector cạnh

Việc xử lý cạnh được thực hiện dựa trên cơ sở thời gian chung và vệ tinh chung đối với hai máy thu. Đối với những cạnh có chất lượng kém cần phải xử lý can thiệp để nâng cao chất lượng cạnh. Phần mềm TBC cho phép người dùng can thiệp để xử lý nâng cao nhờ chức năng Session Editor. Trong đó, người dùng có thể tăng góc ngưỡng, cắt bỏ vệ tinh, cắt bỏ thời gian… để tăng chất lượng cạnh.

Bình sai lưới GPS

Bình sai lưới là công tác cần thiết, nhằm cắt bỏ các trị đo thừa trong lưới GPS. Với phần mềm xử lý số liệu GNSS Trimble Business Center, công tác bình sai lưới sẽ đạt hiệu quả hơn nhờ:

+ Thuật toán Trimble HD-GNSS cung cấp một bước đột phá trong công nghệ giải số nguyên đa trị (Integer Ambiguitys–N). Đối với các đường đáy ngắn, Trimble HD-GNSS có xu hướng kết hợp “Narrow Lane” độ nhiễu pha sóng mang nhỏ nhất. Đối với các đường đáy dài nó có xu hướng kết hợp “Ionospheric-Free” (độ nhiễu pha sóng mang lớn nhất, nhưng không bị lệch).

+ Cải thiện mô hình độ trễ tầng đối lưu (tùy chọn), bằng cách ước lượng những số hiệu chỉnh vào trị đo pha sóng mang.

+ Những lời giải cho đường đáy dài trên 20km có thể được cải tiến bằng cách xử lý với các bản lịch vệ tinh chính xác (Precise Satellite Ephemerides).

Xem thêm: Hướng Dẫn Cách Bỏ Khung Textbox Trong Word 2010, Xóa Bỏ Đường Viền Bao Quanh Text Box Trong Word

Thêm vào đó, ngoài tọa độ bình sai, Trimble Business Center còn cung cấp trị đo sau bình sai (Adjusted GPS Observations) và kết quả đánh giá độ chính xác chiều dài và phương vị các cạnh trong lưới.