1. LÊN KẾ HOẠCH HỌC TẬP Hiển nhiên rằng để làm việc trong một lĩnh vực nào đó, bạn phải bắt đầu bằng cách học những kiến thức cơ bản. Trước hết bạn phải tìm hiểu tổng quan về ngành phân tích dữ liệu, dữ liệu và dữ liệu lớn là gì để bạn xác định đây có phải ngành nghề phù hợp với bản thân mình hay không. Vài năm trước đây, ngành Phân tích dữ liệu thường yêu cầu ứng viên có bằng cấp chuyên môn cao hoặc những ngành nghề có liên quan như Công nghệ thông tin. Nhà tuyển dụng thường ưu tiên những ứng viên có các chứng chỉ liên quan đến data như: DA-100 Microsoft Certified Data Analyst Associate Certified Analytics Professional Cloudera Certified Associate: Data Analyst. Tuy nhiên, tới thời điểm hiện tại những yêu cầu này không còn là bắt buộc với vị trí Data Analyst. Dù background của bạn là marketing, tài chính, sale hay các ngành nghề chăm sóc sức khỏe như y tế đều có thể trở thành Data Analyst. Vậy lộ trình học tốt nhất cho Data Analyst là gì ? Trước hết hãy nâng cấp CV cá nhân bằng những kiến thức cơ bản về dữ liệu như toán xác suất thống kê, khoa học máy tính, trực quan hóa dữ liệu,...Bí quyết của đa số Data Analyst thường sử dụng để lập kế hoạch học tập phù hợp với bản thân là đọc Job Description. Mỗi JD đều yêu cầu ứng viên có kiến thức và kỹ năng rõ ràng giúp bạn dễ dàng có cái nhìn tổng quan nhất về vị trí này. Ngoài ra, hãy tham khảo phần yêu cầu ứng viên để nắm rõ những công cụ nào bắt buộc bạn phải có để hỗ trợ công việc tốt hơn. 2. KỸ NĂNG CHUYÊN MÔN Không riêng gì Data Analytics, bất kì ngành nghề, lĩnh vực nào cũng yêu cầu ứng viên có kỹ năng chuyên môn cụ thể liên quan đến ngành. Dù những kỹ năng này bạn được học ở giảng đường Đại học, học ở các trung tâm hay tích lũy từ kinh nghiệm làm việc đều hoàn toàn có thể trở thành thế mạnh của bạn khi ứng tuyển. Chính vì vậy, hãy xác định rõ những kỹ năng chuyên môn ngành Data Analytics yêu cầu là gì và trau dồi kỹ năng đó. Kỹ năng thống kê Thống kê được hiểu một cách đơn giản là quá trình thu thập, phân tích, khám phá những xu hướng, quy luật vận động, các mối quan hệ của những đối tượng nghiên cứu, … Nắm vững kỹ năng thống kê sẽ giúp bạn định hướng phân tích và hiểu rõ dữ liệu bạn đang làm việc. Tùy thuộc vào lĩnh vực của mỗi công ty sẽ yêu cầu mức độ thành thạo kỹ năng thống kê của ứng viên Thành thạo R hoặc Python Ngôn ngữ R được phát hành vào năm 1994 do một nhóm các nhà thống kê nghiên cứu. Cho tới thời điểm hiện nay, R vẫn là một trong những ngôn ngữ được sử dụng rộng rãi bởi các chuyên gia thống kê và phân tích dữ liệu. Trong phân tích dữ liệu, ngôn ngữ lập trình R hỗ trợ cho việc tính toán và đồ họa thống kê bởi các tính năng tích hợp của nó. Bên cạnh đó, ngôn ngữ R còn cung cấp cho user thư viện lớn giúp giải quyết mọi quy trình trong phân tích dữ liệu. Năm 1991, ngôn ngữ Python được phát hành và sử dụng rộng rãi cho tới hiện tại. Khác với ngôn ngữ R, Python tập trung vào khả năng đọc mã và được sử dụng rộng rãi từ lĩnh vực dữ liệu đến kỹ sư phần mềm. Python có một kho thư viện lớn của bên thứ ba cung cấp đầy đủ chức năng cho khoa học dữ liệu. Ngôn ngữ truy vấn SQL SQL là cụm từ viết tắt của Structured Query Language - ngôn ngữ truy vấn có cấu trúc. Đây là ngôn ngữ tập hợp các lệnh để tương tác với database. Với tính năng lưu trữ, thao tác và truy xuất dữ liệu được lưu trữ trong relational database, SQL là ngôn ngữ hầu như Data Analyst nào cũng phải nắm vững. Ngoài ra, SQL còn là ngôn ngữ cơ sở dữ liệu chuẩn của các hệ thống quản lý cơ sở dữ liệu quan hệ như MySQL, MS Access, Oracle, Postgres và SQL Server,... Đa số các doanh nghiệp hiện này đều sử dụng SQL để xây dựng hệ thống lưu trữ cơ sở dữ liệu. Các dữ liệu sẽ được diễn tả thành nhiều bảng và có mối quan hệ mật thiết với nhau. Data visualization Trực quan hóa dữ liệu là làm cho các xu hướng và mẫu trong dữ liệu thành các dạng đồ họa để dễ dàng đưa ra quyết định trong quản lý và kinh doanh. Các dạng đồ họa của trực quan hóa dữ liệu thường ở dạng đồ thị, biểu đồ và sử dụng các phương pháp, công cụ để minh họa dữ liệu được tốt nhất. Từ những đồ họa này sẽ dễ dàng quan sát và truyền đạt rõ ràng insights từ dữ liệu đến người xem, người đọc. Bằng việc sử dụng trực quan hóa dữ liệu, quản lý/ điều hành sẽ không mất nhiều thời gian vào việc phân tích báo cáo và có thêm thời gian để triển khai các chiến lược dựa vào những thông tin trong đồ họa. Data cleaning và data preparation Như bạn đã biết. data cleaning còn được định nghĩa là quy trình làm sạch dữ liệu. Quy trình này sẽ giúp Data Analyst xử lý và loại bỏ những dữ liệu như sau: Không chính xác Không phù hợp định dạng Bị trùng lặp Không đầy đủ thông tin Không liên quan Không có giá trị Vì những dữ liệu này sẽ khiến kết quả phân tích cuối cùng bị ảnh hưởng và không đáp ứng mục đích của việc phân tích. Gắn liền với data cleaning, data preparation là quá trình làm sạch và chuyển đổi dữ liệu thô trước khi xử lý và phân tích. Data Preparation thường bao gồm các bước từ chuẩn hóa định dạng dữ liệu, kết hợp với các bộ dữ liệu khác nhau cho tới loại bỏ các giá trị ngoại lai (outliers). Ngoài những kỹ năng về mặt chuyên môn, nhà tuyển dụng còn tìm kiếm ứng viên có những kỹ năng mềm như: Kỹ năng giao tiếp Kỹ năng thuyết trình Kỹ năng giải quyết vấn đề Kỹ năng làm việc nhóm