שלב 3: כתיבת קוד לאימון המודל - Pablo-guides מדריכים למפתחים על ידי פבלו רותם

איך לבנות אתר AI כמו צאט גי פי טי \ chat gpt עם מודלים קיימים ולרוס על שרת VPS

שלב 3: כתיבת הקוד לאימון המודל באמצעות המאגרי מידע שיצרנו בשלב הקודם

כעת, נעבור לכתיבת הקוד שיאמן את המודל DistilGPT-2.

טעינת הנתונים:
- נשתמש בחבילה datasets כדי לטעון את נתוני האימון.


from datasets import load_dataset

# טוען את מערך הנתונים מקובץ טקסט
dataset = load_dataset('text', data_files={'train': 'train.txt', 'test': 'test.txt'})

טעינת המודל והטוקניזר:

נשתמש במודל DistilGPT-2 ובטוקניזר שלו.

Copy Code


from transformers import GPT2Tokenizer, GPT2LMHeadModel

tokenizer = GPT2Tokenizer.from_pretrained('distilgpt2')
model = GPT2LMHeadModel.from_pretrained('distilgpt2')

עיבוד הנתונים:

נעבד את הנתונים כך שהמודל יוכל להשתמש בהם.

Copy Code


def tokenize_function(examples):
    return tokenizer(examples['text'], padding='max_length', truncation=True)

tokenized_datasets = dataset.map(tokenize_function, batched=True)

הגדרת פרמטרים לאימון:

נשתמש ב- Trainer כדי להגדיר את פרמטרי האימון.

Copy Code


from transformers import Trainer, TrainingArguments

training_args = TrainingArguments(
    output_dir='./results',
    evaluation_strategy="epoch",
    per_device_train_batch_size=8,
    per_device_eval_batch_size=8,
    num_train_epochs=3,
    weight_decay=0.01,
)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_datasets['train'],
    eval_dataset=tokenized_datasets['test'],
)

אימון המודל:

כעת נבצע את האימון.

Copy Code


trainer.train()

שמירת המודל המאומן:

לאחר האימון, שמור את המודל המאומן כדי שתוכל להשתמש בו באפליקציה שלך.

Copy Code


model.save_pretrained('./trained_model')
tokenizer.save_pretrained('./trained_model')