Llava Pool

This project provides functionalities for training and configuring Vision-Language Models (VLM).

Features

git clone https://github.com/thisisiron/LLaVA-Pool.git
cd LLaVA-Pool

pip install flash-attn --no-build-isolation

This repository was built based on LLaMA-Factory.

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
assets		assets
data		data
examples		examples
scripts/deepspeed		scripts/deepspeed
src/llavapool		src/llavapool
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
run.sh		run.sh