dataset_tools

自製全自動打標all in one

需求python 3.10 3.11 windows

整合 florence-2 自然語言、WD14 tagger、clip score (long clip)、aesthetic predictor v2.5美學模型

+自定義打標流程

直接抓caption.py下來 (不要用git clone)

python caption.py "資料集位置"

就可以跑了

py後面可以放args (中間要空格)

--folder_name 前置角色名 "aaa appearance," OR "two preson include aaa appearance and bbb appearance" ... ___

--not_char 如果前置是概念不是角色 "aaa in the image, " ... ___

--clothtag 前置衣服標(當單人時) ", with black tank top, grey shorts" ... ___

--peoplotag 前置多人動作標(當雙人時) ", back-to-back, after_kiss" ... ___

--drop_colortag刪除WD14顏色標 del "black hair" "brown eyes"... (前置與florence-2打的會保留)

其他比較不會用到的

--continue_caption="天數整數" 從n天內打的標繼續

--rawdata 只打一行也許正則圖這樣做比較好不確定沒測試

--debiased 已棄用已經用更好方式去除專有名詞和ocr

設置clip score上限減少florence偏差，如果發現florence很多作品名、角色幻覺可以用不然不需要會刪掉一些正常的標

--custom_keeptag="字串類似is doing" 自定義前置，實驗性很慢效果差、不要用

--upgrade 升級腳本，有需要才用

--drop_chartag 自動刪除角色特徵標如果用wildcard應該是不需要

打出來格式是三行wildcard，___ 之前是前置

前置, 全部標排序___

accurate, 前置, ___少的標

inaccurate, 前置, ___更少的標

前置是 "排除標" "概念名?" "人數" "角色名?" "衣服?" "多人動作?" "nsfw標" "美學標"

在kohya-ss 中Additional parameters填上

--enable_wildcard 使用多行wildcard，不然只會用第一行

--keep_tokens_separator="__" 固定 __之前的標

可以加上

--network_train_unet_only 只訓練UNET

打勾Shuffle caption 洗牌標籤

Name		Name	Last commit message	Last commit date
Latest commit History 89 Commits
.gitattributes		.gitattributes
Florence2_caption.ipynb		Florence2_caption.ipynb
README.md		README.md
caption.py		caption.py
cluster.py		cluster.py
dev2.py		dev2.py
dev3		dev3
dev4		dev4
main_script.py		main_script.py
main_script_dev.py		main_script_dev.py
makemask.py		makemask.py
phi3.py		phi3.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

dataset_tools

About

Releases

Packages

Languages

hinablue/dataset_tools

Folders and files

Latest commit

History

Repository files navigation

dataset_tools

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages