README.tr.md
<a href="https://trendshift.io/repositories/13944" target="_blank"></a>
Büyük Dil Modelleri için ince ayar veri setleri oluşturmaya yönelik güçlü bir araç
Özellikler • Hızlı Başlangıç • Dokümantasyon • Katkıda Bulunma • Lisans
Bu projeyi beğendiyseniz, lütfen bir Yıldız⭐️ verin veya yazara bir kahve ısmarlayın => Bağış ❤️!
</div>Easy Dataset, Büyük Dil Modeli (LLM) veri setleri oluşturmak için özel olarak tasarlanmış bir uygulamadır. Sezgisel bir arayüzün yanı sıra güçlü yerleşik belge ayrıştırma araçları, akıllı segmentasyon algoritmaları, veri temizleme ve zenginleştirme yetenekleri sunar. Uygulama, çeşitli formatlardaki alana özgü belgeleri; model ince ayarı, geri çağırma destekli üretim (RAG) ve model performans değerlendirmesi gibi senaryolara uygun yüksek kaliteli yapılandırılmış veri setlerine dönüştürebilir.
🎉🎉 Easy Dataset Sürüm 1.7.0 yepyeni değerlendirme yetenekleriyle yayınlandı! Alana özgü belgeleri zahmetsizce değerlendirme veri setlerine (test setleri) dönüştürebilir ve çok boyutlu değerlendirme görevlerini otomatik olarak çalıştırabilirsiniz. Ayrıca insan kör test sistemi ile dikey alan model değerlendirmesi, ince ayar sonrası model performans ölçümü ve RAG geri çağırma oranı değerlendirmesi gibi ihtiyaçlarınızı kolayca karşılayabilirsiniz.
https://github.com/user-attachments/assets/6ddb1225-3d1b-4695-90cd-aa4cb01376a8
<b>Setup.exe</b>
</a>
</td>
<td align="center" valign="middle">
<a href='https://github.com/ConardLi/easy-dataset/releases/latest'>
<b>Intel</b>
</a>
</td>
<td align="center" valign="middle">
<a href='https://github.com/ConardLi/easy-dataset/releases/latest'>
<b>M</b>
</a>
</td>
<td align="center" valign="middle">
<a href='https://github.com/ConardLi/easy-dataset/releases/latest'>
<b>AppImage</b>
</a>
</td>
git clone https://github.com/ConardLi/easy-dataset.git
cd easy-dataset
npm install
npm run build
npm run start
http://localhost:1717 adresini ziyaret edingit clone https://github.com/ConardLi/easy-dataset.git
cd easy-dataset
docker-compose.yml dosyasını düzenleyin:services:
easy-dataset:
image: ghcr.io/conardli/easy-dataset
container_name: easy-dataset
ports:
- '1717:1717'
volumes:
- ./local-db:/app/local-db
- ./prisma:/app/prisma
restart: unless-stopped
Not: NPM ile başlatıldığındaki veritabanı yollarıyla tutarlılığı sağlamak için, mevcut kod deposu dizinindeki
local-dbveprismaklasörlerini bağlama yolları olarak kullanmanız önerilir.
Not: Veritabanı dosyası ilk başlatmada otomatik olarak başlatılacaktır,
npm run db:pushkomutunu manuel olarak çalıştırmanıza gerek yoktur.
docker-compose up -d
http://localhost:1717 adresini ziyaret edinİmajı kendiniz derlemek istiyorsanız, proje kök dizinindeki Dockerfile'ı kullanın:
git clone https://github.com/ConardLi/easy-dataset.git
cd easy-dataset
docker build -t easy-dataset .
docker run -d \
-p 1717:1717 \
-v ./local-db:/app/local-db \
-v ./prisma:/app/prisma \
--name easy-dataset \
easy-dataset
Not: NPM ile başlatıldığındaki veritabanı yollarıyla tutarlılığı sağlamak için, mevcut kod deposu dizinindeki
local-dbveprismaklasörlerini bağlama yolları olarak kullanmanız önerilir.
Not: Veritabanı dosyası ilk başlatmada otomatik olarak başlatılacaktır,
npm run db:pushkomutunu manuel olarak çalıştırmanıza gerek yoktur.
http://localhost:1717 adresini ziyaret edinTopluluktan katkıları memnuniyetle karşılıyoruz! Easy Dataset'e katkıda bulunmak isterseniz, lütfen şu adımları izleyin:
git checkout -b feature/amazing-feature)git commit -m 'Add some amazing feature')git push origin feature/amazing-feature)Lütfen testlerin uygun şekilde güncellendiğinden ve mevcut kodlama stiline uyulduğundan emin olun.
https://docs.easy-dataset.com/geng-duo/lian-xi-wo-men
Bu proje AGPL 3.0 Lisansı altında lisanslanmıştır - detaylar için LICENSE dosyasına bakın.
Bu çalışma faydalı olduysa, lütfen şu şekilde alıntı yapın:
@misc{miao2025easydataset,
title={Easy Dataset: A Unified and Extensible Framework for Synthesizing LLM Fine-Tuning Data from Unstructured Documents},
author={Ziyang Miao and Qiyu Sun and Jingyuan Wang and Yuchen Gong and Yaowei Zheng and Shiqi Li and Richong Zhang},
year={2025},
eprint={2507.04009},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2507.04009}
}