Microsoft Excel (Bài 48): Tìm hiểu về Power Query

Power Query là một công cụ hữu ích cho các công cụ phân tích dữ liệu, xử lý và lập các báo cáo. Vì vậy, hãy cùng Học Excel Online tìm hiểu ngay về Power Query nhé!

Tìm hiểu về Power Query 1

Bữa tiệc đã diễn ra sôi nổi. Tôi đã đến muộn.

Cuối cùng khi tôi đến nơi, thay vì thông thường “Bạn gọi cái này lúc mấy giờ?”, Tôi nhận được câu trả lời “Này; Bạn đã làm được, điều đó thật tuyệt vời. Thật tuyệt khi bạn có thể đến. Để tôi dẫn bạn đi xung quanh”. Không ai coi thường tôi vì tôi đã đến muộn. Họ hài lòng vì tôi đã ở đó và vui mừng kể cho tôi nghe về mọi thứ sẽ xảy ra.

Nghe giống như một bữa tiệc tuyệt vời phải không? Bạn cũng bắt đầu ước rằng mình ở đó phải không? Tin tốt là… bạn đã được mời. Trên thực tế, bạn vừa mới đến.

Bữa tiệc mà tôi đang đề cập đến là bữa tiệc những người đã biết và yêu thích Power Query (hoặc Get & Transform như được biết đến trong Excel 2016 và phiên bản mới hơn). Tôi không thể nhớ lần đầu tiên tôi nghe về Power Query, nhưng tôi nhớ nó cũng giống như Power Pivot. Sau đó, tôi nghe nói rằng đó là một add-in được thêm vào mà tôi phải cài đặt. Suy nghĩ đầu tiên của tôi là “Nghe có vẻ quá nỗ lực; Dù sao nó cũng sẽ là không có giá trị. Tôi thật sự không cần nó. Tôi đã có VBA; Tôi có thể làm mọi thứ tôi cần trong VBA. Nó sẽ chỉ là một sự lãng phí thời gian.” Điều trớ trêu là tôi đã sử dụng Power Query tại thời điểm đó, nó đã giúp tôi tiết kiệm nhiều thời gian.

Qua một thời gian. Tôi nhận ra rằng ngày càng có nhiều chuyên gia Excel nói về nó. Ken Puls, Mynda Treacy, Oz du Soleil đều đang nói về Power Query tuyệt vời như thế nào. Tôi có niềm tin mãnh liệt vào nó. Tôi tự nghĩ: “Tôi không làm việc trong môi trường có dữ liệu rối, tôi không dành hàng giờ để dọn dẹp và khắc phục sự cố về dữ liệu. Cộng với “chuyển đổi dữ liệu” nghe có vẻ giống như điều gì đó tôi cần có bằng cấp về khoa học máy tính.

Excel 2016 đã được phát hành và Power Query được tích hợp trực tiếp vào Excel (mặc dù bây giờ nó được biết đến Get & Transform). Tôi không có lý do gì để không tải xuống hoặc cài đặt. Tôi đã mở giao diện Power Query. Phản ứng tức thì của tôi là “Khó quá, không hiểu, thấy lãng phí thời gian, tôi biết sẽ như vậy.”

Một năm trôi qua, tôi tình cờ thấy một số webinar trên youtube. Tôi bắt đầu suy suy nghĩ lại; đó là Power Query hợp lý đầu tiên mà tôi nghĩ rằng: “PowerQuery không chỉ dành cho dữ liệu rồi mà còn dành cho tất cả các dữ liệu! Việc chuyển đổi dữ liệu có thể đơn giản như chuyển một bảng. Điều này có thể giúp tôi tiết kiệm hàng giờ đồng hồ và rất nhiều mã VBA khó. Tại sao không ai nói với tôi điều này trước đó… oh chờ đã… họ đã làm!”

Đây là cách cuối cùng tôi đã tiếp cận Power Query. Kể từ đó, mọi người sẵn sàng chia sẻ tất cả kiến thức của họ về Power Query. Tôi đã nghiên cứu về Power Query và Powerpivot và bây giờ tôi dựa vào các công cụ này để tiết kiệm thời gian mỗi ngày.

Thật không may, nếu bạn hỏi hầu hết người dùng Excel nếu họ sử dụng Power Query, họ sẽ nhìn bạn một cách trống rỗng, họ không biết đó là gì. Tôi muốn thay đổi điều đó, vì vậy trong một vài bài đăng tôi sẽ tập trung vào việc sử dụng Power Query.

Nếu bạn đang đọc được điều này, thì rất có thể bạn cũng vừa tiếp cận Power Query. Tất cả những gì tôi có thể nói với bạn là: “Này, bạn đã thành công, điều đó thật tuyệt vời. Thật tuyệt khi bạn có thể đến. Để tôi hướng dẫn bạn”. 🙂

POWER QUERY LÀM GÌ?

Power Query là một công cụ ELT. ETL là viết tắt của Extract, Transform và Load. Chúng ta hãy xem xét từng từ đó một cách riêng lẻ để hiểu rõ hơn.

  • Extract – Dữ liệu có thể được trích xuất từ nhiều nguồn khác nhau; cơ sở dữ liệu, tệp CSV, tệp văn bản, cửa sổ làm việc Excel, các ô cụ thể trên cùng một trang tính, trang web và thậm chí một số tệp PDF. Về cơ bản, nếu có dữ liệu được lưu trữ ở đâu đó ở định dạng có cấu trúc hoặc bán cấu trúc, Power Query có thể truy cập và lấy dữ liệu đó ra.
  • Transform – Sau khi dữ liệu đã được trích xuất ở bước trước, nó có thể được làm lọc (tức là xóa khoảng trắng, chia cột, thay đổi định dạng ngày, điền vào khoảng trống, tìm và thay thế,…) và định hình lại (tức là bỏ pivot, xóa cột, v.v.). Khi dữ liệu được trích xuất từ các nguồn khác nhau, nó không chắc là nhất quán, quá trình chuyển đổi được sử dụng để sẵn sàng sử dụng.
  • Load – Sau khi dữ liệu đã được trích xuất và chuyển đổi, nó cần phải được đặt ở đâu đó để bạn có thể sử dụng. Từ góc độ Excel, nó có thể được đẩy vào một trang tính, một mô hình dữ liệu hoặc một truy vấn khác.

Tóm lại, Power Query lấy dữ liệu từ các nguồn khác nhau và biến nó thành thứ có thể sử dụng được.

Là một công cụ, điều này khá hữu ích. Nhưng đây là phần tốt nhất. Khi quy trình ETL đã được tạo, nó có thể được hoạt động nhiều lần chỉ với một cú nhấp chuột. Có thể tiết kiệm hàng giờ làm việc mỗi tuần.

MỘT VÀI VÍ DỤ VỀ TÍNH NĂNG CỦA POWER QUERY

Có phải tất cả nghe có vẻ hơi trừu tượng và khó hiểu? Hãy để tôi chia sẻ một số ví dụ để bạn cảm nhận thực tế về những gì có thể.

VÍ DỤ 1

Giả sử hàng ngày bạn nhận được tệp CSV có bảng giá cập nhật. Thông thường, bạn sẽ mở CSV, sao chép các cột có liên quan vào bảng tính của mình sau đó sử dụng rất nhiều công thức LEFT và RIGHT để chia một số trường văn bản, cuối cùng, bạn sử dụng PivotTable để trình bày thông tin theo đúng định dạng.

Bạn có thể làm tất cả những điều này với Power Query. Chỉ cần lưu tệp CSV vào đúng vị trí, sau đó cập nhật mọi thứ bằng một cú nhấp chuột.

VÍ DỤ 2

Hoặc làm thế nào về tình huống này, mỗi tháng bạn nhận được 30 sổ làm việc Excel từ các bộ phận khác nhau của doanh nghiệp, tất cả các cửa sổ làm việc có cùng định dạng. Bạn mở từng bảng tính và sao chép dữ liệu vào một bảng tính chính để hợp nhất thành một báo cáo tổng thể.

Với Power Query, bạn có thể hợp nhất tất cả dữ liệu cùng một lúc chỉ với một lần làm mới. Bạn không cần mở từng trang tính, không cần sao chép và dán. Chỉ cần lưu tất cả các tệp trong cùng một thư mục, sau đó cập nhật hợp nhất bằng một cú nhấp chuột.

VÍ DỤ 3

Tập đoàn của bạn vừa mua lại một công ty mới. Như thường lệ, hệ thống phần mềm của họ khác với công ty. Ban quản lý hiện không có ý định thay đổi hệ thống IT. Công việc của bạn là tạo một bảng tổng kết doanh số bán hàng cho toàn công ty mỗi tuần. Có vẻ như nó có thể là rất nhiều việc.

Với Power Query, bạn có thể lấy dữ liệu trực tiếp từ mỗi hệ thống và với việc sử dụng bảng sắp xếp, hãy cập nhật trang chính chỉ với một lần làm mới.

SỰ KHÁC BIỆT GIỮA POWER QUERY VÀ GET & TRANSFORM LÀ GÌ

Người dùng bình thường không sử dụng từ “Query” để mô tả các nhiệm vụ mà họ đảm nhận. Đặt từ “Power” ở phía trước và không có gì rõ ràng hơn. Có thể đây là lý do tại sao Microsoft đổi tên thành Get & Transform trong Excel 2016 và đặt nó trong dải Data ribbon. Tôi chắc chắn rằng họ đang cố gắng cung cấp cho người dùng một cách rõ ràng. Tôi chắc rằng nếu bạn hỏi hầu hết mọi người đoán công cụ này hoạt động như thế nào, chỉ dựa vào tên, nhiều người sẽ nhận được một số câu trả lời đúng. Mặc dù nó có thể được gọi là Get and Transform trong Excel 2016, những cái tên Power Query dường như đã quen thuộc với cộng đồng Excel.

POWER QUERY KHÓ HỌC NHƯ THẾ NÀO?

Nếu bạn đang nghĩ rằng bạn cần phải trở thành một lập trình viên? Hoặc ít nhất là một chuyên gia Excel? Bạn sẽ sai. Power Query có giao diện dễ sử dụng được thiết kế cho người dùng hàng ngày.

Có một chút thử thách để học, nhưng hầu hết trong số đó là học những chức năng của từng nút bấm.

Nếu bạn muốn đi sâu vào Power Query, có một ngôn ngữ lập trình gọi là “M” mà bạn có thể học. Nhưng bạn có thể khai thác 99,9% chức năng mà không cần đến nó.

CÁCH CÀI ĐẶT POWER QUERY?

Do sự phát triển của Power Query trong ứng dụng Excel trong những năm gần đây có nghĩa là có một số câu hỏi chính:

  • Bạn có cần tải xuống Power Query không?
  • Bạn nên tải xuống phiên bản Power Query nào?
  • Phiên bản Excel của bạn có tương thích với Power Query không?

Rất may, Jon Acampora có một bài đăng rất chi tiết sẽ cung cấp cho bạn tất cả thông tin bạn cần để cài đặt Power Query.

Thời gian để bắt đầu

Trong một cuộc khảo sát người dùng Power Query, nó cho thấy mức tiết kiệm thời gian trung bình là 22%! Nó thật hữu ích! Hơn một ngày làm việc mỗi tuần với công việc lặp đi lặp lại gây phiền nhiễu bị xóa đối với mỗi người dùng Power Query. Với thống kê đó, hãy bắt đầu học Power Query để bạn có thể bắt đầu tiết kiệm thời gian cho chính mình.

Chuỗi nội dung trong Power Query

  1. Giới thiệu
  2. Nhập dữ liệu
  3. Làm mới dữ liệu Power Query
  4. Sự quan trọng của Power Queeery khi đi làm

Nếu bạn thấy bài viết này hữu ích hoặc nếu bạn có cách tiếp cận tốt hơn, vui lòng để lại bình luận bên dưới.

Bạn có cần trợ giúp để điều chỉnh điều này theo nhu cầu của mình không?

Tôi đoán các ví dụ trong bài đăng này không đáp ứng chính xác tình huống của bạn. Tất cả chúng ta đều sử dụng Excel theo cách khác nhau, vì vậy không thể viết một bài đăng đáp ứng nhu cầu của mọi người. Bằng cách dành thời gian để hiểu các kỹ thuật và nguyên tắc trong bài đăng này (và ở những nơi khác trên trang web này), bạn sẽ có thể điều chỉnh nó cho phù hợp với nhu cầu của mình.

Tuy nhiên, nếu vẫn gặp khó khăn, bạn nên:

  • Đọc các blog khác hoặc xem các video YouTube về cùng chủ đề. Bạn sẽ được hưởng lợi nhiều hơn bằng cách tạo ra các giải pháp của riêng bạn.
  • Hỏi ‘Excel Ninja’ trong văn phòng của bạn. Thật ngạc nhiên với những điều người khác biết.
  • Đặt câu hỏi trong một diễn đàn như Mr Excel hoặc Cộng đồng câu trả lời của Microsoft. Hãy nhớ rằng những người trên các diễn đàn này thường dành thời gian của họ miễn phí. Vì vậy, hãy chú ý soạn thảo câu hỏi của bạn, đảm bảo nó rõ ràng và ngắn gọn. Liệt kê tất cả những điều bạn đã thử và cung cấp ảnh chụp màn hình, phân đoạn mã và sổ làm việc mẫu.
  • Sử dụng Excel Rescue, đối tác tư vấn của tôi. Họ trợ giúp bằng cách cung cấp các giải pháp cho các vấn đề Excel nhỏ hơn.

CÁCH CẤU TRÚC BẢNG DỮ LIỆU ĐÚNG

Việc cấu trúc bảng dữ liệu đúng cách có thể giúp ích rất nhiều:

  • Có thể sử dụng hàm SUMIFS, COUNTIFS để tính toán, báo cáo theo nhiều điều kiện một cách dễ dàng
  • Có thể trích lọc dữ liệu chi tiết bằng Advanced Filter một cách dễ dàng
  • Sử dụng được Pivot Table để làm các báo cáo động, báo cáo phân tích dữ liệu…

Hình dưới đây sẽ mô tả thế nào là 1 bảng dữ liệu được cấu trúc đúng:

Nhưng không phải lúc nào chúng ta cũng làm việc ngay với cấu trúc đúng. Bởi việc nhập dữ liệu trong cấu trúc đúng mất rất nhiều thời gian. Bạn phải nhập đủ nội dung trên tất cả các cột, trong khi với cấu trúc bên phải, chỉ cần nhập mỗi giá trị tại vị trí giao điểm của các đối tượng đã có sẵn. Đó là lý do tại sao người ta lại hay chọn cách nhập dữ liệu trên 1 cấu trúc không đúng chuẩn.

Điều này dẫn tới 1 khó khăn là: phải cấu trúc lại thì mới tính ra kết quả như ý muốn được.

Thử hình dung bạn phải tổ chức lại 1 cách thủ công, copy paste từng phần, rồi phải xoay chuyển cách biểu diễn các nội dung… quả là 1 công việc khó khăn và tốn thời gian.

Power Query giúp bạn dễ dàng cấu trúc lại bảng dữ liệu. Đặc biệt hơn nữa là những gì bạn làm trong Power Query đều được ghi lại, giúp cho việc cập nhật thêm thông tin trong bảng dữ liệu gốc sẽ được tự động cập nhật vào bảng kết quả đã tái cấu trúc.

Tham khảo:

CÁC GIÁ TRỊ ĐƯỢC NHẬP VÀO LÀ ĐÚNG VỀ LOẠI DỮ LIỆU

Khi lấy dữ liệu từ các nguồn không phải từ Excel: Web, SQL, các phần mềm khác… thì chúng ta không để chắc chắn được về loại dữ liệu nhận được. Các dữ liệu dạng Number, Date thường bị nhầm lẫn sang dạng Text, khiến cho việc tính toán sẽ không ra kết quả đúng.

Thông thường bạn sẽ phải sửa lại dữ liệu, định dạng lại. Nhưng mỗi khi muốn cập nhật thêm dữ liệu, bạn sẽ phải thực hiện lại các thao tác đó.

Power Query có thể giúp bạn quy định lại dữ liệu có trong từng cột về đúng loại dữ liệu. Bạn sẽ không còn mất thời gian lo lắng cho việc này nữa. Nạp dữ liệu thô vào, chỉ cần bấm Refresh tại bảng kết quả, bạn đã có được bảng dữ liệu chính xác để làm việc rồi, hơn nữa quá trình này lại được thực hiện 1 cách tự động và rất nhanh.

TẬP HỢP DỮ LIỆU TỪ NHIỀU SHEET, NHIỀU WORKBOOK VÀO 1 BẢNG CHUNG

Tôi đã gặp rất nhiều trường hợp này, đó là khi bạn phải tập hợp dữ liệu từ nhiều chi nhánh, mỗi chi nhánh 1 file Excel giống nhau, hoặc nhiều người làm chung trên 1 file excel, mỗi người 1 Sheet (hay mỗi ngày 1 Sheet). Để báo cáo được, bạn cần phải tập hợp tất cả các dữ liệu này trên 1 bảng chung. Vấn đề là các Sheet, các Workbook sẽ phát sinh thêm thường xuyên. Tập hợp lại đã khó, đảm bảo dữ liệu mới không bị thiếu, sót khi tập hợp còn khó hơn.

Nếu không biết Power Query, bạn sẽ cần dùng tới VBA (gần như chắc chắn). Nhưng VBA trong trường hợp này cũng không hề đơn giản. Những code cần sử dụng trong trường hợp này thường là khó, phức tạp, không dễ để học và làm được trong 1 thời gian ngắn.

Khi biết tới Power Query, tôi đã thực sự ngạc nhiên vì nó có thể giải quyết vấn đề này 1 cách triệt để. Sẽ có 1 chút câu lệnh, nhưng đều rất đơn giản, dễ học, dễ thao tác. Kết quả lại rất bất ngờ: chỉ làm 1 lần, sau này khi thêm Sheet, thêm Workbook thì vẫn tự động cập nhật vào bảng chung. Điều này thật ngoài sức tưởng tượng.

POWER QUERY DỄ HỌC VÀ DỄ SỬ DỤNG

Nếu dành chút thời gian đọc những bài tham khảo được gợi ý ở trên, bạn có thể thấy Power Query rất dễ làm. Bạn sẽ có thể dễ dàng thực hiện theo từng bước. Các bước đó sẽ được ghi lại tự động để bạn không phải làm lại các thao tác đó nữa. Vậy nên việc của bạn chỉ đơn giản là: Học thuộc lòng các thao tác đó.

Tất nhiên sẽ có những trường hợp khó, đòi hỏi phải kỳ công trong việc xử lý. Nhưng tin tôi đi, độ khó khi làm bằng Power Query đã giảm đi rất nhiều lần so với làm bằng VBA.