Try using it in your preferred language.

English

  • English
  • 汉语
  • Español
  • Bahasa Indonesia
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar
translation

Ini adalah postingan yang diterjemahkan oleh AI.

스타트업 커뮤니티 씬디스 (SeenThis.kr)

Weights & Biases, Buku Putih tentang Best Practices Evaluasi LLM Diterbitkan untuk Unduhan Umum

  • Bahasa penulisan: Bahasa Korea
  • Negara referensi: Semua negara country-flag

Pilih Bahasa

  • Bahasa Indonesia
  • English
  • 汉语
  • Español
  • Português
  • Русский
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Italiano
  • Türkçe
  • Tiếng Việt
  • ไทย
  • Polski
  • Nederlands
  • हिन्दी
  • Magyar

Teks yang dirangkum oleh AI durumis

  • W&B telah merilis buku putih "Best Practices for Evaluating Large Language Models (LLM)" di AI EXPO KOREA 2024.
  • Buku putih ini berisi pengalaman W&B dalam menjalankan Leaderboard LLM dan pengetahuan dari para engineer ahli, diterjemahkan ke dalam bahasa Korea dalam 59 halaman melalui kolaborasi dengan Penta System.
  • Buku putih ini menyajikan best practice dalam evaluasi LLM dan roadmap untuk evaluasi yang andal, bertujuan untuk membangun dasar bagi masa depan evaluasi AI generatif.

Weights & Biases (Weights & Biases, selanjutnya disebut W&B) telah merilis whitepaper "Pedoman untuk Evaluasi Model Bahasa Berskala Besar (LLM)" pada tanggal 1 di 'AI EXPO KOREA 2024'. Whitepaper ini merupakan dokumen setebal 59 halaman yang dikompilasi dari pengalaman pengembangan dan operasi 'Horangi Korean LLM Leaderboard (http://horangi.ai)' dan 'Nejumi Japanese LLM Leaderboard' yang dioperasikan oleh W&B, serta pengetahuan dari para ahli LLM di tim global, dan telah diterjemahkan ke dalam bahasa Korea melalui kolaborasi dengan Penta System.

Halaman Unduh Whitepaper ini

URL ini mengarahkan ke versi PDF dari whitepaper: http://wandb.me/kr-llm-eval-wp

Gambaran Umum dan Daftar Isi "Pedoman untuk Evaluasi Model Bahasa Berskala Besar (LLM)"

Whitepaper ini tidak hanya memberikan pedoman untuk evaluasi LLM, tetapi juga bertujuan untuk menyediakan landasan bagi pembangunan masa depan AI generatif dengan mempromosikan pengembangan dan pemilihan model yang lebih baik. Setelah menyajikan gambaran keseluruhan evaluasi LLM, whitepaper ini merangkum tantangan saat ini, menyajikan praktik terbaik untuk evaluasi AI generatif pada titik ini, dan menawarkan peta jalan untuk memberikan evaluasi yang lebih canggih dan andal.

· Gambaran keseluruhan evaluasi model bahasa
· What to evaluate: Aspek yang perlu dievaluasi

  • Performa bahasa umum
  • Performa khusus domain
  • Tata kelola AI
    · How to evaluate: Metode evaluasi
    · Daftar Leaderboard LLM Publik
    · Praktik Evaluasi menggunakan Weights & Biases
    · Refleksi melalui Perbandingan Model LLM

Prospek Evaluasi AI Generatif di Masa Depan

Evaluasi AI generatif di masa depan juga harus terus berubah seiring dengan perkembangan pesat model. Seiring dengan peningkatan performa model, evaluator juga akan menghadapi lebih banyak tantangan dan harus bekerja lebih keras. Model yang sudah mencapai hasil lebih dari 90% dalam evaluasi kemampuan generatif saat ini menunjukkan kebutuhan untuk mengembangkan masalah yang lebih menantang di masa depan.

Seiring dengan meluasnya cakupan penggunaan model AI generatif, terutama dalam penggunaan bisnis dan industri, evaluasi pengetahuan dan kemampuan yang lebih profesional menjadi semakin penting. Karena tidak ada cara untuk mengevaluasi performa model dalam bidang profesional ini secara seragam, pengembangan tugas evaluasi dan kumpulan data di area penting sangat mendesak. Di antara tugas-tugas ini, beberapa memerlukan berbagai bentuk masukan, seperti bahasa, gambar, dan data, yang meningkatkan kesulitan pengembangan.
 
Selain itu, kemudahan penggunaan bagi pengguna juga merupakan faktor penting dalam performa model. Misalnya, dengan meningkatnya kebutuhan layanan komersial seperti kecepatan inferensi, biaya, keandalan API, dan aspek keamanan, kebutuhan untuk membangun lingkungan inferensi lokal juga muncul.

Pengenalan Weights & Biases

Weights & Biases, Inc. berpusat di San Fransisco, AS, dan menyediakan platform bagi pengembang dan operator yang mencakup manajemen eksperimen ML tingkat perusahaan dan alur kerja MLOps end-to-end. WandB digunakan dalam berbagai kasus penggunaan pembelajaran mendalam, termasuk pengembangan LLM, segmentasi gambar, pengembangan obat baru, dan dianggap sebagai praktik terbaik baru dalam pengembangan AI yang dipercaya oleh lebih dari 800.000 pengembang pembelajaran mesin di seluruh dunia, termasuk NVIDIA, OpenAI, dan Toyota.

Situs web W&B Korea: https://kr.wandb.com

Situs web: https://wandb.ai/site

Kontak
Weights & Biases
Penjualan/Pemasaran
Yoo Si-hyun
+81-(0)70-4000-5657

seenthis.kr
스타트업 커뮤니티 씬디스 (SeenThis.kr)
스타트업 커뮤니티 씬디스 (http://SeenThis.kr Startup Community web) 씬디스는 스타트업 커뮤니티입니다. 1. 모르면 물어보세요 2. 알면 답해주세요
seenthis.kr
Flitto dan Upstage Menandatangani Perjanjian Kerjasama untuk Pengembangan Data Bahasa AI Flitto dan Upstage telah menandatangani perjanjian kerjasama untuk pengembangan data bahasa di Asia. Melalui kerja sama ini, kedua perusahaan akan meningkatkan kolaborasi untuk meningkatkan kinerja model bahasa yang sangat besar, dan berencana untuk berko

9 Mei 2024

RSN, Berpartisipasi di AI Expo Korea… Platform Analisis Tren Pasar Global Berbasis AI Generatif 'GlobalMI' Dirilis Perdana RSN akan meluncurkan platform analisis tren pasar global 'Global MI' di 'AI Expo Korea 2024'. Platform ini memanfaatkan teknologi RAG untuk menurunkan biaya pemrosesan data dan meningkatkan kepercayaan, serta didukung sLLM yang dikembangkan sendiri untuk

25 April 2024

SK C&C Memperkenalkan 'Solure LLMOps', Platform Dukungan Implementasi sLLM Sesuai Kebutuhan Pelanggan SK C&C telah meluncurkan 'Solure LLMOps', platform untuk membangun model bahasa besar (sLLM) yang disesuaikan dengan kebutuhan perusahaan. Platform ini mendukung pembuatan sLLM dengan mudah menggunakan drag and drop dengan memanfaatkan berbagai model dasa

20 Mei 2024

Apa itu LLM (Large Language Model)? Model bahasa besar (LLM) adalah teknologi inti kecerdasan buatan yang mempelajari kumpulan data teks yang besar untuk memperoleh kemampuan pemrosesan bahasa yang mirip manusia dan dapat digunakan di berbagai bidang seperti chatbot, terjemahan, dan pembuat
세상 모든 정보
세상 모든 정보
세상 모든 정보
세상 모든 정보

1 April 2024

Ulasan Soal Latihan Tes Tulis Sertifikasi Analis Survei Sosial Tingkat 2 (Rekomendasi Tempat Tes Tulis di SMK Industri Masa Depan) Saya bagikan ulasan tentang tes tulis sertifikasi Analis Survei Sosial Tingkat 2 pada Mei 2022 dan soal latihan. Termasuk 12 soal tes tulis, cara mengurangi kesalahan observasi, metode meningkatkan keandalan pengukuran, dan lain-lain. Anda juga bisa menem
롱롱이
롱롱이
롱롱이
롱롱이
롱롱이

27 April 2024

Membangun AI Full Stack dengan Open Source Model LLM (Large Language Model) sumber terbuka baru terus bermunculan di ekosistem AI. Mistral, Llama, phi-2, dan model lain dengan kinerja kuat dan lisensi terbuka telah dirilis, dan berbagai alat untuk memanfaatkannya juga sedang dikembangkan. Framewor
RevFactory
RevFactory
RevFactory
RevFactory

5 Februari 2024

Kami sedang merekrut, manusia Munculnya pasar kerja jenis baru di mana AI mempekerjakan manusia telah memunculkan kebutuhan akan pemikiran tentang bagaimana memastikan kepercayaan AI dan mengubah cara kerja manusia untuk memamerkan kemampuan mereka. Payman AI menghadirkan layanan AI y
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son
Byungchae Ryan Son

22 Mei 2024

Rilis OpenELM Apple / Phi-3 MS / Llama 3 Meta Apple, Microsoft, Meta, dan perusahaan big tech utama lainnya baru-baru ini merilis model bahasa besar yang dikembangkan sendiri, menghidupkan kembali industri AI. Model yang diluncurkan kali ini berevolusi ke berbagai arah, termasuk pengurangan ukuran, o
해리슨 블로그
해리슨 블로그
해리슨 블로그
해리슨 블로그

27 April 2024

Apakah menulis di durumis meningkatkan visibilitas pencarian dalam berbagai bahasa? Layanan blog durumis menyediakan konten yang diterjemahkan ke berbagai bahasa untuk pengguna global, menghasilkan hingga 50 kali lebih banyak eksposur pencarian dan klik dibandingkan dengan versi asli Korea. Layanan ini masih dalam tahap awal, tetapi tumb
durumis official blog
durumis official blog
Gambar dengan tanda tanya
durumis official blog
durumis official blog

11 April 2024