Vậy Big Data là gì?
Và tầm ảnh hưởng của nó như thế nào đến thế giới công nghệ nói riêng và cuộc sống hiện đại của con người nói chung? Bài viết này chúng ta sẽ cùng phân tích và tìm hiểu kỹ hơn nhé !
#1. Bigdata là gì?
Đúng như tên gọi của nó, Big Data (Big là LỚN, còn Data có nghĩa là DỮ LIỆU), Big Data là DỮ LIỆU LỚN, là sự tổng hợp và phân tích một số lượng dữ liệu khổng lồ để khai thác những giá trị hữu ích.
Những dữ liệu này trải dài trên nhiều lĩnh vực khác nhau, tùy từng mục đích khác nhau mà dữ liệu sẽ khác nhau, định dạng lưu trữ trong Big Data có thể là dạng text, hình ảnh, video, mp3….
Những dữ liệu này là sự tổng hợp không chỉ ở một giai đoạn mà có thể là liên tục trong nhiều năm, nhiều thập kỉ và vẫn sẽ tiếp tục trong những năm kế tiếp.
Theo định nghĩa của Gartner:
“Big Data là tài sản thông tin, mà những thông tin này có khối lượng dữ liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có công nghệ mới để xử lý hiệu quả nhằm đưa ra được các quyết định hiệu quả, khám phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hóa được quá trình xử lý dữ liệu”
Big Data không phải là một khái niệm mới, nhưng gần đây nó mới thực sự nở rộ khi nhu cầu dữ liệu cho MÁY HỌC, AI (trí tuệ nhân tạo) hay nhu cầu phân tích dữ liệu con người cho mục đích kinh tế, Y tế và các lĩnh vực xã hội khác ngày một tăng cao.
Tất cả những nhu cầu trên đã kéo theo Bigdata phát triển rất nhanh trong thời gian gần đây !
Không những vậy, Big Data cũng là một trong 3 yếu tố cốt lõi của kỹ thuật số trong CMCN 4.0, bên cạnh AI và IoT.
Bạn có thể đọc thêm bài viết tìm hiểu về cuộc cách mạng công nghiệp 4.0 để thấy được tương lai chúng ta nhé !
Có thể đọc đến đây nhiều bạn sẽ tự hỏi:
Dữ liệu như thế nào thì được gọi là Big Data và có một con số cụ thể về dung lượng của Bigdata hay không?
Vâng, theo như mình tìm hiểu thì không có một con số cụ thể nào để quy định dữ liệu là Big Data, nhưng con số trung bình của Big Data rơi vào khoảng vài Petabyte trở lên (1Pb = 1000GB).
Trong khi đó, dữ liệu dạng chữ (text) rất nhẹ, 1Mb chứa được dữ liệu của khoảng 3000 trang sách, vậy suy ra 1 Petabyte dữ liệu bạn biết nó khủng khiếp thế nào rồi đó 😀
Nhưng thực ra mình nghĩ là cũng không cần thiết phải quy định về dung lượng để trở thành Big Data làm gì cả, bởi chất lượng vẫn luôn hơn số lượng.
Có nghĩa là dữ liệu lớn nhưng không đáp ứng được nhu cầu thì cũng vứt, mà cái quan trọng nhất vẫn là chất lượng của dữ liệu đó có đáp ứng được nhu cầu hay không thôi.
#2. Big Data được sử dụng như thế nào?
Gần như mọi lĩnh vực ngày nay đều cần đến Big Data, nó là yếu tố cốt lõi cho sự phát triển của công nghệ 4.0 đến đời sống. Ví dụ về một vài lĩnh vực như:
Y tế : Với dữ liệu về sức khỏe của người dân từ các bệnh viện, hồ sơ y tế… các chuyên gia sẽ dựa vào những dữ liệu này để phân tích, từ đó đưa ra những vấn đề về sức khỏe cần phải quan tâm của những nhóm người nhất định.
Ví dụ như ở một độ tuổi nào đó, một thành phố nào đó, hay một vùng miền nào đó… Qua đó có những biện pháp cần thiết để nâng cao sức khỏe người dân.
Hay nói chuyên sâu hơn một chút, với những dữ liệu về gen, về di truyền của người Việt chúng ta.
Các chuyên gia sẽ sớm tìm ra những giải pháp tối ưu để phát triển thể trạng chung cho nòi giống trong tương lai, hoặc sẽ phát hiện được những nguy cơ tiềm ẩn gây ảnh hưởng xấu tới thể trạng người Việt nói chung…
Thương mại điện tử: Kể từ khi ra đời, thứ có lẽ thay đổi thói quen của người Việt nhiều nhất chính là thương mại điện tử, kinh doanh trên Internet (kinh doanh online).
Không còn là những hàng quán cửa tiệm, không còn là những lần phải chạy thật xa, nhờ người tìm hàng để có được món hàng như ý, cũng không còn sợ bị lừa đảo nhiều như trước kia nữa.
Chỉ đơn giản với cài cú click, vuốt vuốt, chạm chạm thôi là chúng ta có thể mua hoặc bán mọi thứ một cách dễ dàng. Tất cả diễn ra đều rất nhanh chóng và tiện lợi !
Với những dữ liệu về hành vi tiêu dùng trên sàn thương mại điện tử: bao gồm thói quen lựa chọn, giờ giấc mua sắm… tất cả sẽ được phân tích để đưa ra phương án bán hàng hiệu quả.
Ví dụ như việc sắp xếp sản phẩm sao cho những gì mà khách hàng cần, khách hàng biết, khách hàng quen thuộc sẽ được hiển thị để khách hàng dễ tiếp cận nhất.
Nói cụ thể hơn một chút nhé:
Bạn có để ý là khi bạn mua điện thoại trên các trang TMĐT thì nó sẽ gợi ý cho bạn những sản phẩm cần thiết khác cho sản phẩm bạn đã chọn mua, như Ốp lưng, Pin dự phòng, dán cường lực…
Hoặc khi bạn mua bàn phím máy tính thì nó sẽ gợi ý kê tay, tấm lót… Đó !
Kinh tế: Kinh tế luôn đi đôi với dữ liệu, phải cần và luôn cần có dữ liệu kinh tế thì các nhà hoạch định mới có thể làm việc và đưa ra tình hình chung về kinh tế của một doanh nghiệp, của một khu vực, hay của cả đất nước được.
Từ những số liệu ta có thể biết khu vực nào thuần nông nghiệp, khu vực nào công nghiệp hóa phát triển… Từ đó đưa ra những chính sách phù hợp hơn, không gây lãng phí nhân lực tiền bạc.
…….
Đối với nhà nước thì Big Data còn giúp chính phủ các nước có thể dự đoán được tỷ lệ thất nghiệp, hay xu hướng việc làm trong tương lai để có thể đầu tư tập trung vào các lĩnh vực đó… từ đó giúp đất nước phát triển tốt hơn.
Việc thu thập và sử dụng hiệu quả dữ liệu từ BigData có thể giúp doanh nghiệp thực hiện được các chiến lược kinh doanh hiệu quả, phân tích những rủi ro có thể gặp phải, hoặc một cá nhân/ tổ chức đạt được mục đích mà họ mong muốn..
Nói tóm lại, Big Data còn được sử dụng trong hầu hết các lĩnh vực của cuộc sống, từ trường học, xây dựng, ngân hàng, nghiên cứu khoa học.. cho đến quảng cáo, xác định điều kiện giao thông theo thời gian thực.
Vậy nên có thể nói Big Data sẽ giúp cuộc sống của chúng ta trở nên đơn giản hơn, dễ dàng hơn…
#3. Big Data được lấy từ đâu?
Vâng, Big Data được thu thập từ hàng tỷ người dùng Internet mỗi ngày (thông qua việc tìm kiếm Google, sử dụng Facebook, sử dụng các ứng dụng chát, mua sắm, chơi game…. nói chung là từ rất nhiều nguồn).
Không những vậy, Big Data còn có thể được thu thập từ các thiết bị có kết nối Internet, tức là từ các máy móc nữa.
Từ khi thế giới hình thành Internet cho đến năm 2003 thì thế giới chỉ có khoảng 5 tỷ GB dữ liệu, nhưng đến năm 2011 thì 5 tỷ GB dữ liệu được tạo ra chỉ trong 2 ngày.
Vậy nên có thể nói 90% dữ liệu toàn cầu được tạo ra chỉ trong 1 vài năm trở lại đây.
Các bạn có thể thấy mức độ phủ sóng Internet trên toàn cầu diễn ra chóng mặt như thế nào chưa 🙂
Một dữ liệu được gọi là Big Data thường có những đặc trưng sau:
- Valume: Khối lượng lớn
- Velocity: Tốc độ gia tăng dữ liệu.
- Variety: Đa dạng dữ liệu (hình ảnh, âm thanh, video..)
- Veracity: Tính xác thực, độ chính xác
- Value: Giá trị
#4. Để nghiên cứu Big Data cần những gì?
Trước kia, muốn nghiên cứu dữ liệu thì chúng ta cần giấy tờ hay một vài chiếc máy tính với cấu hình phổ thông là đã đủ.
Nhưng với Big Data thì lại là một chuyện khác, đây là DỮ LIỆU LỚN, một nguồn dữ liệu khổng lồ và có thể kéo dài trong nhiều năm liền.
Vậy nên sẽ không có một cá nhân hay tổ chức nào mà chỉ dùng giấy tờ hay máy tính thông thường để nghiên cứu và quản lý chúng được.
Mà Big Data buộc phải được quản lý và sử dụng bởi những hệ thống máy tính lớn, với sức mạnh siêu khủng, với phần mềm chuyên dụng mà nó được thiết kế riêng cho việc phân tích dữ liệu chứ không bán đại trà trên thị trường.
Đọc thêm: Máy tính lượng tử là gì? Tìm hiểu về máy tính lượng tử
Chắc chắn không thể chỉ là những chiếc máy tính phổ thông, đó là lý do vì sao gần đây Việt Nam mới có những đầu tư hơn cho Big Data.
Bởi giờ đây chúng ta đã có nhân lực (những chuyên gia), và có cả điều kiện kinh tế để có thể đầu tư cho những hệ thống rất tốn kém này.
Dữ liệu và thông tin luôn là những thứ sẽ còn dùng và sẽ mãi còn dùng cho tới sau này, có thể nói là vĩnh cửu. Vậy nên những hệ thống lưu trữ dữ liệu hay nghiên cứu Big Data là luôn luôn cần thiết.
Xu hướng cách mạng công nghiệp 4.0 đã tạo điều kiện để những quốc gia đang trên đà phát triển như Việt Nam có thể dễ dàng tiếp cận chúng, để đi tắt đón đầu so với các nước đã phát triển. Khi đã có thể quản lý được rồi, những ứng dụng và lợi ích của Big Data là không cần phải bàn cãi gì thêm.
Okay, trên đây là bài viết của mình về Big Data, mình đã dành rất nhiều thời gian cho bài viết này để có được những thông tin chất lượng và chính xác.
Vậy nên, bạn cũng đừng quên đánh giá 5* cho bài viết và theo dõi Blog Chia Sẻ Kiến Thức mỗi ngày để đón đọc những bài viết mới hơn nữa nhé 🙂