|
|
hace 8 meses | |
|---|---|---|
| .. | ||
| accelerate_configs | hace 8 meses | |
| .env.example | hace 8 meses | |
| 00_quick_test.py | hace 8 meses | |
| 01_dataset_loading.py | hace 8 meses | |
| 02_reward_functions.py | hace 8 meses | |
| 03_lora_configuration.py | hace 8 meses | |
| 04_sft_training.py | hace 8 meses | |
| 05_grpo_training.py | hace 8 meses | |
| 06_complete_pipeline.py | hace 8 meses | |
| 07_model_evaluation.py | hace 8 meses | |
| 08_distributed_training.py | hace 8 meses | |
| config.json | hace 8 meses | |