Tìm hiểu về Big Data (Dữ liệu lớn)

Thứ tư - 10/01/2018 20:29

Big Data (dữ liệu lớn) là một thuật ngữ để chỉ một tập hợp tổng thể các dữ liệurất phức tạp và lớn và bạn có thể cảm nhận những công cụ bình thường hàng ngày chúng ta đang dùng không thể tải nổi nó.

Tìm hiểu về Big Data (Dữ liệu lớn)

1. Big Data là gì?

Theo wikipedia: Dữ liệu lớn (Tiếng Anh: Big data) là một thuật ngữ cho việc xử lý một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Dữ liệu lớn bao gồm các thách thức như phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư. Thuật ngữ này thường chỉ đơn giản đề cập đến việc việc sử dụng các phân tích dự báo, phân tích hành vi người dùng, hoặc một số phương pháp phân tích dữ liệu tiên tiến khác trích xuất giá trị từ dữ liệu mà ít khi đề cập đến kích thước của bộ dữ liệu. "Vài nghi ngờ cho rằng số lượng của dữ liệu có sẵn hiện nay thực sự lớn, nhưng đó không phải là đặc trưng phù hợp nhất của hệ sinh thái dữ liệu mới này." (Nguồn: https://vi.wikipedia.org/wiki/D%E1%BB%AF_li%E1%BB%87u_l%E1%BB%9Bn )

Sự tiến bộ vượt bậc của khoa học và công nghệ, đến những sự ra đời các kênh truyền thông đòi hỏi một hệ thống dữ liệu cực lớn mang tính toàn cầu như mạng xã hội và các thiết bị công nghệ tiên tiến đã đặt ra thách thức không hề nhỏ cho các nền công nghiệp khác nhau phải tìm ra cách khác để xử lý dữ liệu.

600
Tổng quan về Big Data (Click vào ảnh để xem ảnh lớn). Nguồn: visiblebanking.com

Big Data (“dữ liệu lớn”) là tập hợp dữ liệu có dung lượng vượt khả năng hoạt động của các ứng dụng và công cụ truyền thống. Kích cỡ Big Data ngày càng lớn hơn và quan trọng hơn trong thế giới hiện đại và đặc biệt là nền công nghiệp 4.0 hiện nay, tính đến năm 2012 nó có thể nằm trong khoảng vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024 terabyte) chỉ cho một tập hợp dữ liệu, thật kinh khủng phải không nào.

Quay ngược dòng thời gian trong năm 2001, nhà phân tích Doug Laney của hãng META Group (nay là công ty nghiên cứu Gartner) đã nói rằng:

Những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều: tăng về lượng (volume), tăng về vận tốc (velocity) và tăng về chủng loại (variety). Giờ đây, Gartner cùng với nhiều công ty khác trong lĩnh vực công nghệ đã tiếp tục sử dụng mô hình 3V này để định nghĩa nên Big Data. Đến năm 2012, Gartner bổ sung thêm rằng Big Data ngoài ba tính chất trên thì còn phải “cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào sự vật/sự việc và tối ưu hóa các quy trình làm việc”.

Theo định nghĩa của Gartner: “Big Data là tài sản thông tin, mà những thông tin này có khối lượng dữ liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có công nghệ mới để xử lý hiệu quả nhằm đưa ra được các quyết định hiệu quả, khám phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hóa được quá trình xử lý dữ liệu”.

Phân tích dữ liệu cũng có thể giúp các doanh nghiệp thích nghi, tạo ra nội dung website thu hút nhiều khách hàng hơn, có được cái nhìn sâu sắc vào hành vi mua hàng. Dữ liệu càng nhiều thì càng tốt cho công ty. Để làm được như vậy, doanh nghiệp nên cung cấp nội dung trên nhiều nền tảng social media, nhằm thu thập được nhiều thông tin từ những điểm tiếp xúc với khách hàng.

Chúng ta có thể lấy các thí nghiệm của Máy gia tốc hạt lớn (LHC) ở Châu Âu làm ví dụ cho Big Data. Khi các thí nghiệm này được tiến hành, kết quả sẽ được ghi nhận bởi 150 triệu cảm biến với nhiệm vụ truyền tải dữ liệu khoảng 40 triệu lần mỗi giây. Kết quả là nếu như LHC ghi nhận hết kết quả từ mọi cảm biến thì luồng dữ liệu sẽ trở nên vô cùng lớn, có thể đạt đến 150 triệu petabyte mỗi năm, hoặc 500 exabyte mỗi ngày, cao hơn 200 lần so với tất cả các nguồn dữ liệu khác trên thế giới gộp loại.

Tìm hiểu sâu hơn về Big Data

Thế giới tính đến năm 2003 có khoảng 5 tỷ gigabyte dữ liệu và cũng một lượng dữ liệu như vậy được tạo ra chỉ trong 2 ngày trong năm 2011 cho đến năm 2013, khối lượng dữ liệu này được tạo ra cứ sau mỗi 10 phút. Do đó, không có gì ngạc nhiên khi mà 90% dữ liệu của toàn thế giới hiện nay được tạo ra trong một vài năm qua. Tất cả dữ liệu này cực kỳ hữu ích và nó đã không được màng tới trước khi thuật ngữ “Big Data” ra đời.

Bạn có biết chỉ với mỗi giây trên thế giới có khoảng 600 triệu vụ va chạm giữa các hạt vật chất diễn ra, nhưng sau khi chọn lọc lại từ khoảng 99,999% các luồng dữ liệu đó, chỉ có tầm 100 vụ va chạm được các nhà khoa học quan tâm. Điều này có nghĩa là cơ quan chủ quản LHC phải tìm những biện pháp mới để quản lý và xử lí hết mớ dữ liệu khổng lồ này.

5 thuật ngữ về Big. Data

5 thuật ngữ về Big Data

Năm 2000, một trạm quan sát vũ trụ tại New Mexico có tên Sloan Digital Sky Sruver và chỉ sau vài tuần hoạt động đã thu thập dữ liệu lớn hơn tổng lượng dữ liệu mà ngành thiên văn học đã thu thập được trong quá khứ là 200GB mỗi đêm và hiện nay đã lên đến hơn 140 terabyte. Hoặc như việc giải mã di truyền của con người trước đây mất đến 10 năm để xử lí, còn bây giờ người ta chỉ cần một tuần là đã hoàn thành ... và rất nhiều ví dụ khác về Big Data trên thế giới.

2. Big Data trong thế giới ngày nay

Hiện nay thế giới tạo ra 1 petabyte dữ liệu trong mỗi 11 giây theo tài liệu của Intel vào tháng 9/2013 và nó tương đương với một đoạn video HD dài 13 năm. Các công ty, doanh nghiệp cũng đang sở hữu Big Data của riêng mình, chẳng hạn như Google, Facebook hay trang bán hàng trực tuyến như Alibaba hay Ebay sử dụng các trung tâm dữ liệu lớn trên cả thế giới để truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về sản phẩm của họ.

Mạng xã hội Facebook quản lí hơn 50 tỉ bức ảnh từ người dùng tải lên, YouTube hay Google lưu hết các truy vấn của người dùng để phục vụ cho quảng cáo và các mục đích thương mại khác hay công ty thương mại điện tử hàng đầu thế giới Amazon phải xử lí hàng triệu các lượt truy vấn mỗi ngày từ khách hàng và các đối tác bán hàng. Amazon sử dụng hệ thống Linux từ năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng lần lượt là 7,8TB, 18,5TB và 24,7TB.

Dưới đây là danh sách các nhà đầu tư vào IoT

Danh sách các nhà đầu tư vào IoT

Thống kê từ CBInsights

Chúng ta có một vài số liệu thú vị về Big Data như sau:

  • Các hệ thống RFID (một dạng kết nối tầm gần, như kiểu NFC nhưng có tầm hoạt động xa hơn và cũng là thứ dùng trong thẻ mở cửa khách sạn) tạo ra lượng dữ liệu lớn hơn 1.000 lần so với mã vạc truyền thống
  • Chỉ trong vòng 4 giờ của ngày “Black Friday” năm 2012, cửa hàng Walmart đã phải xử lí hơn 10 triệu giao dịch tiền mặt, tức là khoản 5.000 giao diện mỗi giây.
  • Dịch vụ chuyển phát UPS nhận khoảng 39,5 triệu yêu cầu từ khách hàng của mình mỗi ngày
  • Dịch vụ thẻ VISA xử lí hơn 172.800.000 giao dịch thẻ chỉ trong vòng một ngày mà thôi
  • Trên Twitter có 500 triệu dòng tweet mới mỗi ngày, Facebook thì có 1,15 tỉ thành viên tạo ra một mớ khổng lồ dữ liệu văn bản, tập tin, video…
(theo tập đoàn SAS)

Những nguồn chính tạo ra Big Data:

  1. Hộp đen dữ liệu: đây là dữ liệu được tạo ra bởi máy bay, bao gồm máy bay phản lực và trực thăng. Hộp đen dữ liệu này bao gồm thông tin tạo ra bởi giọng nói của phi hành đoàn, các bản thu âm và thông tin về chuyến bay.
  2. Dữ liệu từ các kênh truyền thông xã hội: Đây là dữ liệu được tạo ra và phát triển bởi như các trang web truyền thông xã hội như Twitter, Facebook, Instagram, Pinterest và Google+.
  3. Dữ liệu giao dịch chứng khoán: Đây là số liệu từ thị trường chứng khoán đối với quyết định mua và bán cổ phiếu được thực hiện bởi khách hàng.
  4. Dữ liệu điện lực: đây là dữ liệu tạo ra bởi điện lực. Nó bao gồm các thông tin cụ thể từ các điểm giao nhau của các nút thông tin sử dụng.
  5. Dữ liệu giao thông: dữ liệu này bao gồm sức chưa và các mẫu phương tiện giao thông, độ sẵn sàng và khoảng cách đã đi được của từng phương tiện giao thông.
  6. Dữ liệu các thiết bị tìm kiếm: đây là dữ liệu được tạo ra từ các công cụ tìm kiếm và đây cũng là nguồn dữ liệu lớn nhất của Big Data. Công cụ tìm kiếm có cơ sở dữ liệu cực kỳ rộng lớn, nơi họ có thể tìm thấy dữ liệu họ cần.

20 nguồn Big Data uy tín có thể truy cập miễn phí

  1. Data.gov - nơi mà mọi người được phép tự do truy cập tất cả các dữ liệu của Chính phủ Mỹ bao gồm các thông tin khác nhau, từ khí hậu đến tội phạm đang giam giữ.
  2. Data.gov.uk – nơi tương tự của Chính phủ Anh. Tại đây, mọi người có thể tập hợp được siêu dữ liệu trên tất cả các sách và các ấn phẩm của Anh kể từ năm 1950.
  3. Cục Điều tra Dân số Mỹ - bao gồm các thông tin có giá trị như dân số, địa lý và dữ liệu khác. Tương tự là kho dữ liệu mở Liên minh châu Âu, bao gồm các dữ liệu điều tra dân số của các tổ chức Liên minh châu Âu.
  4. Và một thứ yêu thích của chúng ta đó là Facebook. Những biểu đồ của FB cung cấp cho chúng ta các thông tin và giao diện các ứng dụng, sau khi truy cập các thông tin công khai được cung cấp bởi người sử dụng.
  5. Lĩnh vực y tế có Healthdata.gov: của Mỹ và Trung tâm Thông tin chăm sóc Y tế và xã hội NHS, từ Anh.

(Nguồn: Chuyên gia Big Data Bernard Marr cung cấp)

Năm 2010, ngành công nghiệp Big Data có giá trị hơn 100 tỉ USD và đang tăng trưởng với tốc độ chóng mặt là 10% mỗi năm và nhanh gấp đôi so với tổng ngành phần mềm nói chung. Một số công ty lớn trên thế giới như Software AG, Oracle, IBM, Microsoft, SAP, EMC, HP và Dell đã chi hơn 15 tỉ USD cho các công ty chuyên về quản lí và phân tích dữ liệu.

3. Big Data dùng công nghệ gì?

Một thông tin quan trọng là Big Data cần đến kĩ thuật khai thác thông tin rất đặc biệt do tính chất phức tạp và khổng lồ, năm 2011, tập đoàn McKinsey đã phân tích và đề xuất những công nghệ có thể dùng với Big Data bao gồm:
  • Crowsourcing (tận dụng các nguồn lực từ nhiều thiết bị điện toán trên toàn cầu để xử lí dữ liệu cùng nhau)
  • Các thuật toán về gen và di truyền
  • Những biện pháp machine learning (ý chỉ các hệ thống có khả năng học hỏi từ dữ liệu, một nhánh của trí tuệ nhân tạo), xử lí ngôn ngữ tự nhiên (giống như Siri hay Google Voice Search, nhưng cao cấp hơn),
  • Xử lý tín hiệu, mô phỏng, phân tích chuỗi thời gian, mô hình hóa, kết hợp các server mạnh lại với nhau....

Chúng ta sẽ không đề cập chuyên sâu về các công nghệ này vì đa phần trong các kỹ thuật này đều rất phức tạp.

Ngoài ra, các cơ sở dữ liệu hỗ trợ xử lí dữ liệu song song, ứng dụng hoạt động dựa trên hoạt động tìm kiếm, file system dạng rời rạc, các hệ thống điện toán đám mây (bao gồm ứng dụng, nguồn lực tính toán cũng như không gian lưu trữ) và bản thân Internet cũng là những công cụ đắc lực phục vụ cho công tác nghiên cứu và trích xuất thông tin từ “dữ liệu lớn”. Hiện nay cũng có vài cơ sở dữ liệu theo dạng quan hệ (bảng) có khả năng chứa hàng petabyte dữ liệu, chúng cũng có thể tải, quản lí, sao lưu và tối ưu hóa cách sử dụng Big Data nữa.

8 Công nghệ thường được thấy trong Big Data
8 Công nghệ thường được thấy trong Big Data (Nguồn m-brain.com)

Những người làm việc với Big Data thường cảm tháy khó chịu với các hệ thống lưu trữ dữ liệu vì tốc độ chậm, do đó họ thích những loại ổ lưu trữ nào có thể gắn trực tiếp vào máy tính (cũng như ổ cứng gắn trong máy tính của chúng ta vậy). Ổ đó có thể là SSD cho đến các đĩa SATA nằm trong một lưới lưu trữ cỡ lớn. Những người này nhìn vào ổ NAS hay hệ thống lưu trữ mạng SAN với góc nhìn rằng những thứ này quá phức tạp, đắt và chậm. Những tính chất nói trên không phù hợp cho hệ thống dùng để phân tích Big Data vốn nhắm đến hiệu năng cao, tận dụng hạ tầng thông dụng và chi phí thấp. Ngoài ra, việc phân tích Big Data cũng cần phải được áp dụng theo thời gian thực hoặc cận thời gian thực, thế nên độ trễ cần phải được loại bỏ bất kì khi nào và bất kì nơi nào có thể.

4. Big Data có thể giúp gì được cho chúng ta?

Big Data vô cùng giá trị, để thu thập nó cần có cả một quy trình rất lớn nhưng sở hữu, sau đó phân tích và để sử dụng nó như thế nào lại còn khó hơn. Vì dữ liệu Big Data gồm rất nhiều lĩnh vực, nhiều nguồn khác nhau nên nó rất có ích cho tất cả các lĩnh vực trong xã hội như: y tế, giáo dục, an ninh, an ninh mạng, khoa học như nghiên cứu môi trường, biến đổi khí hậu; kinh doanh mà cụ thể nhất là Internet marketing, online marketing…

Tập đoàn SAS nói vấn đề thật sự không nằm ở việc bạn thu thập dữ liệu, thay vào đó, là bạn dùng Big Data để làm gì. Nhìn chung, có bốn lợi ích mà Big Data có thể mang lại: cắt giảm chi phí, giảm thời gian, tăng thời gian phát triển và tối ưu hóa sản phẩm, đồng thời hỗ trợ con người đưa ra những quyết định đúng và hợp lý hơn.

Nếu để ý một chút, bạn sẽ thấy khi mua sắm online trên eBay, Amazon hoặc những trang tương tự, trang này cũng sẽ đưa ra những sản phẩm gợi ý tiếp theo cho bạn, ví dụ khi xem điện thoại, nó sẽ gợi ý cho bạn mua thêm ốp lưng, pin dự phòng; hoặc khi mua áo thun thì sẽ có thêm gợi ý quần jean, dây nịt... Do đó, nghiên cứu được sở thích, thói quen của khách hàng cũng gián tiếp giúp doanh nghiệp bán được nhiều hàng hóa hơn.

Vậy những thông tin về thói quen, sở thích này có được từ đâu? Chính là từ lượng dữ liệu khổng lồ mà các doanh nghiệp thu thập trong lúc khách hàng ghé thăm và tương tác với trang web của mình. Chỉ cần doanh nghiệp biết khai thác một cách có hiệu quả Big Data thì nó không chỉ giúp tăng lợi nhuận cho chính họ mà còn tăng trải nghiệm mua sắm của người dùng, chúng ta có thể tiết kiệm thời gian hơn nhờ những lời gợi ý so với việc phải tự mình tìm kiếm.

Big Data và cuộc sống

Người dùng cuối như mình và các bạn sẽ được hưởng lợi cũng từ việc tối ưu hóa như thế, chứ bản thân chúng ta thì khó mà tự mình phát triển hay mua các giải pháp để khai thác Big Data bởi giá thành của chúng quá đắt, có thể đến cả trăm nghìn đô. Ngoài ra, lượng dữ liệu mà chúng ta có được cũng khó có thể xem là “Big” nếu chỉ có vài Terabyte sinh ra trong một thời gian dài.

Xa hơi một chút, ứng dụng được Big Data có thể giúp các tổ chức, chính phủ dự đoán được tỉ lệ thất nghiệp, xu hướng nghề nghiệp của tương lai để đầu tư cho những hạng mục đó, hoặc cắt giảm chi tiêu, kích thích tăng trưởng kinh tế, v/v... thậm chí là ra phương án phòng ngừa trước một dịch bệnh nào đó, giống như trong phim World War Z, nước Israel đã biết trước có dịch zombie nên đã nhanh chóng xây tường thành ngăn cách với thế giới bên ngoài.

Mà cũng không cần nói đến tương lai phim ảnh gì cả, vào năm 2009, Google đã sử dụng dữ liệu Big Data của mình để phân tích và dự đoán xu hướng ảnh hưởng, lan truyền của dịch cúm H1N1 đấy thôi. Dịch vụ này có tên là Google Flu Trends. Xu hướng mà Google rút ra từ những từ khóa tìm kiếm liên quan đến dịch H1N1 đã được chứng minh là rất sát với kết quả do hai hệ thống cảnh báo cúm độc lập Sentinel GP và HealthStat đưa ra. Dữ liệu của Flu Trends được cập nhật gần như theo thời gian thực và sau đó sẽ được đối chiếu với số liệu từ những trung tâm dịch bệnh ở nhiều nơi trên thế giới.

Còn theo Oracle, việc phân tích Big Data và những dữ liệu dung lượng lớn đã giúp các tổ chức kiếm được 10,66$ cho mỗi 1$ chi phí phân tích, tức là gấp 10 lần! Một trường học ở một quận lớn tại Mỹ cũng có được sự tăng trưởng doanh thulà 8 triệu USD mỗi năm, còn một công ty tài chính ẩn danh khác thì tăng 1000% lợi nhuận trên tổng số tiền đầu tư của mình trong vòng 3 năm.

5. Tương lai của Big Data

5 năm nữa, dữ liệu sẽ được sản xuất gấp gần 45 lần so với 5 năm trước đây. Với lượng dữ liệu khổng lồ này, doanh nghiệp không thể lờ đi trước cuộc cách mạng dữ liệu và ảnh hưởng của nó tới nền kinh tế thời kỹ thuật số. Những ông chủ doanh nghiệp thông minh sẽ tìm cách khai thác thông tin và biết cách vận dụng những công cụ phân tích cần thiết để biến một người dùng Facebook trở thành một khách hàng trọn đời.

Trong khi đó, Daniel Kaufman, giám đốc đổi mới về thông tin của cơ quan nghiên cứu thuộc Bộ quốc phòng Mỹ thì cho rằng dữ liệu sinh học sẽ ngày càng được quan tâm hơn, và rồi người ta sẽ dùng dữ liệu này để đưa ra những lời khuyên có ảnh hưởng lớn đến lối sống và cuộc đời của con người. Ví dụ, bạn có nên thêm một dĩa cơm tấm sườn nữa không, hay là nên ăn thêm một dĩa cơm gà? Bộ quốc phòng Mỹ muốn sử dụng kiểu suy nghĩ như thế (thay cơm bằng pizza nhé) để áp dụng cho binh lính của mình và hiện họ đang thử nghiệm trên chuột.

Không chỉ có các công ty lớn, các công ty khởi nghiệp (startup) cũng bắt tay vào sử dụng và nghiên cứu về Big Data, cho chúng ta thấy tầm quan trọng của Big Data đối với cuộc sống hiện đại ngày nay và trong tương lai (đó cũng là lý do mà khuyên các bạn có định hướng học CNTT thì Big Data cũng là một gợi ý rất giá trị.)

Giám đốc Swan còn suy nghĩ thêm rằng các công ty chuyên cung cấp giải pháp Big Data sẽ không còn bán dữ liệu và phân tích cho từng doanh nghiệp hay công ty riêng lẻ để phục vụ cho những mục đích quá chuyên biệt. Thay vào đó, họ sẽ mở rộng nó và áp dụng Big Data nhằm giải quyết những vấn đề trong đời thường và trả lời cho các nhu cầu cơ bản của con người. Đó sẽ là sự thay đổi về tính ứng dụng của Big Data.

Trong tương lai thì chắc các bạn điều biết sự phát triển mạnh mẽ như thế nào của Internet vạn vật (IoT), hàng tỉ tỉ các thiết bị kết nối Internet chia sẻ thông tin, bạn có thể điều kiển, quản lý mọi thứ trong nhà của bạn từ xa thông qua smartphone,… đó là viễn cảnh tương lại chắc chắn sẽ xảy ra. Cùng với sự phát triển đó thì nguồn dữ liệu sẽ tăng theo cấp số nhân và Big Data sẽ vô cùng to lớn và nó cũng sẽ làm đau đầu các nhà phân tích, hoạch định chính sách làm sao để quản lý, phát triển Big Data một cách có lợi nhất cho chúng ta. Và không để mình không bắt kịp xu thế, các công ty tập đoàn cộng nghệ lớn đã bắt tay đầu tư vào IoT để có thể làm chủ Big Data trong thời gian sắp tới.

Các Startup sử dụng Big Data theo thống kê từ CBInsights

Các Startup sử dụng Big Data theo thống kê từ CBInsights
Ảnh nguồn cbinsights.com

 

Trong tương lai, chúng ta sẽ còn tiếp tục chứng kiến sự tăng trưởng của Big Data. Hiện nay có thể bạn cũng đã nghe đến khái niệm Internet of Things, tức là mang Internet đến với mọi thứ trong đời sống hằng ngày. Dữ liệu từ Internet of Things thực chất cũng là được thu thập từ một mạng lưới rất nhiều các cảm biến và thiết bị điện tử, và nó cũng là một trong những nguồn của Big Data. Lượng dữ liệu khổng lồ này có thể cho các nhà nghiên cứu biết được hành vi tiêu dùng của khách hàng, từ đó tinh chỉnh những thiết bị Internet of Things cho phù hợp hơn, bắt chúng phục vụ đời sống hằng ngày của chúng ta một cách hiệu quả hơn. Nó cũng có thể được dùng cho việc sản xuất, từ đó giảm sự liên quan của con người. Như lời của Daniel Kaufman dự đoán thì “con người sẽ làm ít hơn” nhờ Big Data.

6. Một số ví dụ thực tiễn gần gũi với bạn về Big Data

Các tập đoàn lớn thường có lợi thế tài chính trong việc thuê các nhà thống kê để thu thập, phân tích và báo cáo về dữ liệu người tiêu dùng. Trong khi đó, những công ty nhỏ cũng có thể dùng các công cụ miễn phí hoặc ít phí để thu thập thông tin có giá trị, qua đó hiểu biết chính xác hơn các hành vi mua của khách hàng:
  • Google Analytics: Đây là công cụ phân tích của Google nhằm đánh giá lưu lượng truy cập trang web của bạn và chỉ ra cách khách tìm hàng thấy trang web, thời gian họ ở lại trang, vị trí đăng nhập và nhiều thông tin khác
  • Facebook Insights: Công cụ này cho phép bạn biết mức độ thường xuyên các bài viết của bạn được chia sẻ cũng như địa điểm và thời gian chia sẻ.
  • Tweriod và Followerwonk: Các chương trình này cũng thu thập dữ liệu từ các phương tiện social media và có thể cung cấp thông tin về giới tính, vị trí và mức độ hoạt động của chủ tài khoản social media.
  • YouTube Analytics: Nếu công ty của bạn đang hoạt động trên YouTube, đây là công cụ tuyệt vời để khai thác thông tin về nhân khẩu học của những người xem video bạn và họ đang ở đâu.
Một khi bạn đang tiếp cận những điểm dữ liệu, đó cũng là lúc bạn phải sử dụng những con số này nhằm nâng cao doanh thu và lợi nhuận.

7. Tạm kết

Tóm lại, Big Data là thách thức đặt ra cho các tổ chức, doanh nghiệp trong thời đại số hiện nay. Một khi làm chủ được dữ liệu lớn thì họ sẽ có cơ hội thành công lớn hơn trong bối cảnh cạnh tranh ngày nay, thế giới thì sẽ được hưởng lợi hơn từ việc trích xuất thông tin một cách chính xác hơn, hữu ích hơn với chi phí thấp hơn. Vẫn còn đó những chỉ trích xoay quanh Big Data, tuy nhiên lĩnh vực này vẫn còn rất mới và chúng ta hãy chờ xem trong tương lai Big Data sẽ tiến hóa như thế nào.

Khả năng Big Data của Ngôi Sao Số

Ngôi Sao Số là đơn vị có khả năng phân tích và truy vấn cơ sở dữ liệu lớn dựa trên các công nghệ phổ biến như Data chứng khoán, Data SMS ... và điển hình Ngôi Sao Số đã thực tế hoàn thiện dự án phân tích và truy vấn CSDL chứng khoán của công ty cổ phần chứng khoán Bảo Minh (BMSC) tại website https://www.bmsc.com.vn/

Tổng hợp từ nhiều nguồn