![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
![]() |
|
분산 된 AI 솔루션 제공 업체가 개발 한 인공 지능 교육 이미지 데이터 세트는 Google 플랫폼 Kaggle에서 상당한 성공을 거두었습니다.
An artificial intelligence training image data set developed by decentralized AI solution provider OORT has seen considerable success on Google’s platform Kaggle.
분산 된 AI 솔루션 제공 업체가 개발 한 인공 지능 교육 이미지 데이터 세트는 Google 플랫폼 Kaggle에서 상당한 성공을 거두었습니다.
OORT’s Diverse Tools Kaggle data set listing was released in early April and has since seen it climb to the first page in multiple categories. Kaggle is a Google-owned online platform for data science and machine learning competitions, learning and collaboration.
OORT의 다양한 도구 Kaggle 데이터 세트 목록은 4 월 초에 출시되었으며 그 이후로 여러 카테고리의 첫 페이지로 올라가는 것을 보았습니다. Kaggle은 데이터 과학 및 기계 학습 경쟁, 학습 및 협업을위한 Google 소유 온라인 플랫폼입니다.
Ramkumar Subramaniam, core contributor at crypto AI project OpenLedger, recognized that a front-page Kaggle ranking is a strong social signal, indicating that the data set is engaging the right communities of data scientists, machine learning engineers and practitioners.
Crypto AI Project Openledger의 핵심 기고자 인 Ramkumar Subramaniam은 프론트 페이지 Kaggle 순위가 강력한 소셜 신호임을 인식하여 데이터 세트가 데이터 과학자, 기계 학습 엔지니어 및 실무자의 올바른 커뮤니티에 참여하고 있음을 나타냅니다.
Max Li, founder and CEO of OORT, said that the firm observed promising engagement metrics that validate the early demand and relevance of its training data gathered through a decentralized model.
OORT의 창립자이자 CEO 인 Max Li는 회사가 분산 모델을 통해 수집 된 교육 데이터의 초기 요구와 관련성을 검증하는 유망한 참여 지표를 관찰했다고 말했다.
"We're grateful for the positive response from the Kaggle community," said Li. "This achievement reflects the hard work and dedication of our team in developing high-quality, diverse, and accessible AI training data."
Li는“Kaggle 커뮤니티의 긍정적 인 반응에 감사드립니다. "이 성과는 고품질, 다양하며 접근 가능한 AI 교육 데이터를 개발하는 데있어 우리 팀의 노력과 헌신을 반영합니다."
OORT plans to release multiple data sets in the coming months. Among those is an in-car voice commands data set, one for smart home voice commands and another for deepfake videos meant to improve AI-powered media verification.
OORT는 앞으로 몇 달 안에 여러 데이터 세트를 출시 할 계획입니다. 그중에는 차량 내 음성 명령 데이터 세트, 하나는 Smart Home Voice 명령 및 다른 하나는 AI 기반 미디어 검증을 개선하기위한 DeepFake 비디오 용입니다.
The data set in question was independently verified to have reached the first page in Kaggle’s General AI, Retail & Shopping, Manufacturing, and Engineering categories earlier this month. At the time of publication, it lost those positions following a possibly unrelated data set update on May 6 and another on May 14.
해당 데이터 세트는 이달 초 Kaggle의 General AI, 소매 및 쇼핑, 제조 및 엔지니어링 카테고리의 첫 페이지에 도달 한 것으로 독립적으로 확인되었습니다. 출판 당시 5 월 6 일에 관련된 데이터 세트 업데이트와 5 월 14 일에 해당 위치를 잃었습니다.
Recognizing the achievement, Subramaniam said that it’s not a definitive indicator of real-world adoption or enterprise-grade quality.
Subramaniam은 업적을 인식하여 실제 채택 또는 엔터프라이즈 급 품질의 결정적인 지표는 아니라고 말했다.
What sets OORT’s data set apart is not just the ranking, but the provenance and incentive layer behind the data set.
OORT의 데이터 세트를 차별화하는 것은 순위 일뿐 만 아니라 데이터 세트의 출처와 인센티브 계층입니다.
"In a world where image scarcity and poisoning techniques are increasing, verifiable and community-sourced/incentivized data sets become more valuable than ever," said Subramaniam. "Such projects can become not just alternatives, but pillars of AI alignment and provenance in the data economy."
Subramaniam은“이미지 부족과 중독 기술이 증가하고 검증 가능하며 커뮤니티 소싱/인센티브 된 데이터 세트가 그 어느 때보 다 가치가있는 세상에서는 그 어느 때보 다 가치가 있습니다. "이러한 프로젝트는 대안뿐만 아니라 데이터 경제에서 AI 정렬 및 출처의 기둥이 될 수 있습니다."
Data published by AI research firm Epoch AI estimates that human-generated text AI training data will be exhausted in 2028. The pressure is high enough that investors are now mediating deals granting rights to copyrighted materials to AI companies.
AI 연구 회사 인 Epoch AI가 발표 한 데이터는 2028 년에 인간이 생성 된 텍스트 AI 교육 데이터가 소진 될 것이라고 추정합니다. 압력은 현재 AI 회사에 대한 저작권을 가진 자료에 대한 권리를 부여하는 거래를 중재하고있을만큼 충분히 높습니다.
Reports concerning increasingly scarce AI training data and how it may limit growth in the space have been circulating for years. While synthetic (AI-generated) data is increasingly used with at least some degree of success, human data is still largely viewed as the better alternative, higher-quality data that leads to better AI models.
AI 교육 데이터가 점점 부족하고 공간의 성장을 제한 할 수있는 방법에 관한 보고서는 수년간 순환하고 있습니다. 합성 (AI 생성) 데이터는 적어도 어느 정도의 성공으로 점점 더 많이 사용되고 있지만, 인간 데이터는 여전히 더 나은 AI 모델로 이어지는 더 나은 대안의 고품질 데이터로 크게 간주됩니다.
When it comes to images for AI training specifically, things are becoming increasingly complicated with artists purposely sabotaging training efforts to protect their images from being used for AI training without permission.
AI 훈련의 이미지와 관련하여 구체적으로, 아티스트들이 의도적으로 AI 훈련에 사용되는 것을 방지하기위한 예술가들과 함께 예술가들이 의도적으로 훈련 노력을 방해하는 것들로 인해 상황이 점점 더 복잡해지고 있습니다.
One such project, Nightshade, allows users to "poison" their images and severely degrade model performance.
그러한 프로젝트 중 하나 인 Nightshade는 사용자가 이미지를 "독살"하고 모델 성능을 심각하게 저하시킬 수 있습니다.
"We're entering an era where high-quality image data will become increasingly scarce, and in this situation, verifiable and community-sourced/incentivized data sets like OORT's are more valuable than ever," said Subramaniam.
Subramaniam은“우리는 고품질 이미지 데이터가 점점 부족 해지는 시대에 들어가고 있으며,이 상황에서는 OORT와 같은 검증 가능하고 커뮤니티 소싱/인센티브 된 데이터 세트가 그 어느 때보 다 가치가 있습니다.
In this case, the OORT data set is a collection of diverse images from various domains, including food, fashion, architecture, technology, and art, which are released under a CC BY-4.0 license and collected via a tokenized crowdsourcing campaign.
이 경우 OORT 데이터 세트는 식품, 패션, 건축, 기술 및 예술을 포함한 다양한 도메인의 다양한 이미지 모음으로 CC By-4.0 라이센스에 따라 출시되고 토큰 화 된 크라우드 소싱 캠페인을 통해 수집됩니다.
The project aims to provide a balanced and comprehensive data set that can be used to train image recognition models for various tasks, such as object detection, image segmentation, and image generation.
이 프로젝트는 객체 감지, 이미지 세분화 및 이미지 생성과 같은 다양한 작업에 대한 이미지 인식 모델을 훈련시키는 데 사용할 수있는 균형 잡힌 포괄적 인 데이터 세트를 제공하는 것을 목표로합니다.
The initiative was funded through a token offering in early 2021, and saw participation from members of the blockchain community, who provided image contributions in exchange for OORT tokens.
이 이니셔티브는 2021 년 초에 토큰 제안을 통해 자금을 조달했으며 OORT 토큰과의 대가로 이미지 기여를 제공 한 블록 체인 커뮤니티 회원의 참여를 보았습니다.
The project's Devotees collected and formatted the images, and they were finally released on Kaggle in early April. It reached the first page in multiple categories within a month of release.
이 프로젝트의 헌신자들은 이미지를 수집하고 형식화했으며 4 월 초 Kaggle에서 마침내 출시되었습니다. 출시 한 달 안에 여러 카테고리의 첫 페이지에 도달했습니다.
The OORT data set has also been recognized by leading AI and blockchain publications and websites, further highlighting its significance and innovation.
OORT 데이터 세트는 또한 AI 및 블록 체인 간행물 및 웹 사이트를 선도하여 인식하여 그 중요성과 혁신을 더욱 강조합니다.
This content is not financial advice and does not necessarily represent the views of CCNR and should not be viewed as an endorsement.
이 콘텐츠는 재정적 조언이 아니며 반드시 CCNR의 견해를 나타내는 것은 아니며 보증으로 간주되어서는 안됩니다.
부인 성명:info@kdj.com
제공된 정보는 거래 조언이 아닙니다. kdj.com은 이 기사에 제공된 정보를 기반으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다. 암호화폐는 변동성이 매우 높으므로 철저한 조사 후 신중하게 투자하는 것이 좋습니다!
본 웹사이트에 사용된 내용이 귀하의 저작권을 침해한다고 판단되는 경우, 즉시 당사(info@kdj.com)로 연락주시면 즉시 삭제하도록 하겠습니다.