Điểm nhấn mới trong ngành AI: Giá trị của việc gán nhãn dữ liệu vượt xa khả năng tính toán
Gần đây, trong lĩnh vực trí tuệ nhân tạo đã xuất hiện một xu hướng đáng chú ý: việc gán nhãn dữ liệu đang trở thành một lĩnh vực có giá trị hơn so với khả năng tính toán. Dấu hiệu rõ ràng của xu hướng này là một ông lớn công nghệ đã chi 14,8 tỷ USD để mua gần một nửa cổ phần của một công ty gán nhãn dữ liệu, gây ra chấn động trong toàn bộ giới công nghệ. Trong khi đó, một số dự án Web3 AI vẫn đang nỗ lực thoát khỏi nhãn "thổi phồng khái niệm". Đằng sau sự tương phản lớn này, thị trường dường như đã bỏ qua một số yếu tố quan trọng.
Khả năng tính toán tập hợp mặc dù là một khái niệm thu hút sự chú ý, nhưng bản chất của khả năng tính toán là một hàng hóa tiêu chuẩn hóa, điểm cạnh tranh chính nằm ở giá cả và khả năng tiếp cận. Tuy nhiên, lợi thế này có thể nhanh chóng biến mất với sự điều chỉnh giá của các nhà cung cấp dịch vụ đám mây lớn hoặc sự gia tăng cung cấp.
So với đó, gán nhãn dữ liệu là một lĩnh vực khác biệt cần sự thông minh và phán đoán chuyên nghiệp của con người. Gán nhãn dữ liệu chất lượng cao bao gồm kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, tất cả những điều này không thể dễ dàng sao chép hoặc tiêu chuẩn hóa. Ví dụ, gán nhãn chẩn đoán hình ảnh ung thư chính xác cần trực giác chuyên môn của bác sĩ ung thư có kinh nghiệm, trong khi phân tích cảm xúc thị trường tài chính chính xác thì không thể thiếu kinh nghiệm thực chiến của các nhà giao dịch dày dạn.
Một công ty chuyên gán nhãn dữ liệu đã thành công làm nổi bật một thực tế bị bỏ qua: ở giai đoạn hiện tại, khả năng tính toán không còn là tài nguyên khan hiếm, cấu trúc mô hình cũng đang trở nên đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu đã được xử lý cẩn thận. Danh sách khách hàng của công ty này được coi là "đội hình toàn sao" trong giới AI, bao gồm nhiều công ty công nghệ nổi tiếng và các cơ quan chính phủ.
Tuy nhiên, mô hình ghi nhãn dữ liệu truyền thống gặp vấn đề trong thiết kế khuyến khích. Ví dụ, một bác sĩ có thể dành hàng giờ để ghi nhãn hình ảnh y tế, nhưng chỉ nhận được khoản thù lao rất nhỏ, trong khi giá trị của mô hình AI được đào tạo từ những dữ liệu này có thể lên tới hàng tỷ đô la. Sự phân bổ giá trị không công bằng này đã cản trở nghiêm trọng ý chí cung cấp dữ liệu chất lượng cao.
Trong bối cảnh này, một số dự án Web3 AI đang cố gắng viết lại các quy tắc phân phối giá trị của việc gán nhãn dữ liệu bằng công nghệ blockchain. Thông qua cơ chế khuyến khích bằng token, những người gán nhãn dữ liệu không còn là "công nhân dữ liệu" giá rẻ, mà là những "cổ đông" thực sự của mạng AI. Mô hình này có thể phù hợp hơn cho các tình huống gán nhãn dữ liệu, có tiềm năng đạt được sự phân phối giá trị công bằng hơn.
Dù là những ông lớn công nghệ truyền thống hay các dự án Web3, tất cả đều đã nhận ra tầm quan trọng của dữ liệu chất lượng cao. Khi các ông lớn truyền thống xây dựng các rào cản dữ liệu bằng tiền bạc, Web3 đang cố gắng xây dựng một hệ sinh thái dữ liệu dân chủ hơn thông qua kinh tế token. Cuộc "chiến tranh lạnh" về quyền kiểm soát tương lai của AI đã âm thầm bắt đầu, và chất lượng dữ liệu sẽ trở thành yếu tố quyết định thắng bại.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
21 thích
Phần thưởng
21
8
Chia sẻ
Bình luận
0/400
GasFeeCrier
· 08-01 04:57
150 tỷ thật sự là đốt tiền nhỉ
Xem bản gốcTrả lời0
FudVaccinator
· 07-29 08:49
148 tỷ? Điên rồi sao?
Xem bản gốcTrả lời0
DefiSecurityGuard
· 07-29 06:00
mmm... phát hiện kế hoạch hũ mật ong web3 điển hình. DYOR nhưng những "dự án AI" hiển thị tất cả các chỉ báo rugpull cổ điển thật sự
Xem bản gốcTrả lời0
LiquidityOracle
· 07-29 05:57
Có vẻ như lại có người đang thổi phồng khái niệm.
Xem bản gốcTrả lời0
SchrodingerAirdrop
· 07-29 05:54
Chú thích mới là cốt lõi, Airdrop chỉ là một quả bóng thôi.
Xem bản gốcTrả lời0
TestnetNomad
· 07-29 05:53
Một thành viên của phong trào "ngả lưng", kỹ sư frontend đang lướt sóng. Đừng cố gắng nữa, dù có đánh dấu cũng không cố nổi đâu.
Xem bản gốcTrả lời0
SchroedingerAirdrop
· 07-29 05:51
Thổi phồng cái này cái kia?
Xem bản gốcTrả lời0
VirtualRichDream
· 07-29 05:40
Đánh dấu có giá trị như vậy? Để tôi bán một quả thận trước đã.
Sự trỗi dậy của đánh dấu dữ liệu, sự tái cấu trúc giá trị trong ngành AI, các dự án Web3 có thể trở thành tâm điểm mới.
Điểm nhấn mới trong ngành AI: Giá trị của việc gán nhãn dữ liệu vượt xa khả năng tính toán
Gần đây, trong lĩnh vực trí tuệ nhân tạo đã xuất hiện một xu hướng đáng chú ý: việc gán nhãn dữ liệu đang trở thành một lĩnh vực có giá trị hơn so với khả năng tính toán. Dấu hiệu rõ ràng của xu hướng này là một ông lớn công nghệ đã chi 14,8 tỷ USD để mua gần một nửa cổ phần của một công ty gán nhãn dữ liệu, gây ra chấn động trong toàn bộ giới công nghệ. Trong khi đó, một số dự án Web3 AI vẫn đang nỗ lực thoát khỏi nhãn "thổi phồng khái niệm". Đằng sau sự tương phản lớn này, thị trường dường như đã bỏ qua một số yếu tố quan trọng.
Khả năng tính toán tập hợp mặc dù là một khái niệm thu hút sự chú ý, nhưng bản chất của khả năng tính toán là một hàng hóa tiêu chuẩn hóa, điểm cạnh tranh chính nằm ở giá cả và khả năng tiếp cận. Tuy nhiên, lợi thế này có thể nhanh chóng biến mất với sự điều chỉnh giá của các nhà cung cấp dịch vụ đám mây lớn hoặc sự gia tăng cung cấp.
So với đó, gán nhãn dữ liệu là một lĩnh vực khác biệt cần sự thông minh và phán đoán chuyên nghiệp của con người. Gán nhãn dữ liệu chất lượng cao bao gồm kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, tất cả những điều này không thể dễ dàng sao chép hoặc tiêu chuẩn hóa. Ví dụ, gán nhãn chẩn đoán hình ảnh ung thư chính xác cần trực giác chuyên môn của bác sĩ ung thư có kinh nghiệm, trong khi phân tích cảm xúc thị trường tài chính chính xác thì không thể thiếu kinh nghiệm thực chiến của các nhà giao dịch dày dạn.
Một công ty chuyên gán nhãn dữ liệu đã thành công làm nổi bật một thực tế bị bỏ qua: ở giai đoạn hiện tại, khả năng tính toán không còn là tài nguyên khan hiếm, cấu trúc mô hình cũng đang trở nên đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu đã được xử lý cẩn thận. Danh sách khách hàng của công ty này được coi là "đội hình toàn sao" trong giới AI, bao gồm nhiều công ty công nghệ nổi tiếng và các cơ quan chính phủ.
Tuy nhiên, mô hình ghi nhãn dữ liệu truyền thống gặp vấn đề trong thiết kế khuyến khích. Ví dụ, một bác sĩ có thể dành hàng giờ để ghi nhãn hình ảnh y tế, nhưng chỉ nhận được khoản thù lao rất nhỏ, trong khi giá trị của mô hình AI được đào tạo từ những dữ liệu này có thể lên tới hàng tỷ đô la. Sự phân bổ giá trị không công bằng này đã cản trở nghiêm trọng ý chí cung cấp dữ liệu chất lượng cao.
Trong bối cảnh này, một số dự án Web3 AI đang cố gắng viết lại các quy tắc phân phối giá trị của việc gán nhãn dữ liệu bằng công nghệ blockchain. Thông qua cơ chế khuyến khích bằng token, những người gán nhãn dữ liệu không còn là "công nhân dữ liệu" giá rẻ, mà là những "cổ đông" thực sự của mạng AI. Mô hình này có thể phù hợp hơn cho các tình huống gán nhãn dữ liệu, có tiềm năng đạt được sự phân phối giá trị công bằng hơn.
Dù là những ông lớn công nghệ truyền thống hay các dự án Web3, tất cả đều đã nhận ra tầm quan trọng của dữ liệu chất lượng cao. Khi các ông lớn truyền thống xây dựng các rào cản dữ liệu bằng tiền bạc, Web3 đang cố gắng xây dựng một hệ sinh thái dữ liệu dân chủ hơn thông qua kinh tế token. Cuộc "chiến tranh lạnh" về quyền kiểm soát tương lai của AI đã âm thầm bắt đầu, và chất lượng dữ liệu sẽ trở thành yếu tố quyết định thắng bại.