Sunday, September 28, 2025

Development Note 2025/09/28 Milestone V0.1








Development Note: This dataset includes “13,304 original images”. 95.9% which are 12,765 original images, is unfiltered and taken during a total of 7 days' trip. An additional 2.7% consists of carefully selected high-quality photos of mine, including my own drawings and paintings, and the remaining 1.4% 184 images are in the public domain. The dataset was used to train a custom-designed diffusion model (550M parameters) with a resolution of 768x768 on a single NVidia 4090 GPU for a period of 10 days of training from SCRATCH.

Talk about "Art", not just technology, and extend slightly more about the motivation.

The "Milestone" name came from the last conversation with Gary Faigin on 11/25/2024; Gary passed away 09/06/2025, just a few weeks ago. Gary is the founder of Gage Academy of Art in Seattle. In 2010, Gary contacted me for Gage Academy's first digital figure painting classes. He expressed that digital painting is a new type of art, even though it is just the beginning. Gary is not just an amazing artist himself, but also one of the greatest art educators, and is a visionary. I had a presentation to show him this particular project that trains an image model strictly only on personal images and the public domain. He suggests "Milestone" is a good name for it.

As AI increasingly blurs the lines between creation and replication, the question of originality requires a new definition. This project is an experiment in attempting to define originality, demonstrating that a model trained solely on personal works can generate images that reflect a unique artistic vision. It's a small step, but a hopeful one, towards defining a future where AI can be a tool for authentic self-expression.


Posted on Reddit, and it seems most people enjoy it, and also, there was one user who was skeptical about it who believed this model was either finetuned ot trained on more than 13K original images. I take this to mean the result is very successful and can officially call the name "Milestone".


"Milestone" is not a particular model name or a dataset's name; it is an experimental project to search for originality after 2022, when image generation became popular, which was Stable Diffusion 1.x trained on LAION 5B with 5 billion images from the entire internet.

Monday, September 15, 2025

Development Note 2025/09/15

 


This dataset comprises 8060 original images. The majority (95%) are unfiltered photos taken during a one-week trip. An additional 1% consists of carefully selected high-quality photos, 2% are my own drawings and paintings, and the remaining 2% are public domain images. The dataset was used to train a custom-designed diffusion model with a resolution of 512x512 on an NVidia 4090 GPU for a period of 4 days training from scratch.

所有圖片資料集包含 8060 張原始圖片。其中大部分(95%)是在一週旅行期間拍攝的未經塞選的照片。另外 1% 是挑選的高品質照片,2% 是我自己過去的繪畫與素描作品,其餘 2% 則是公共領域圖片。這個是一個重新設計與擴散模型,生成解析度為 512x512,從零開始在 4090 GPU 上訓練了 4 天。

Sunday, April 13, 2025

模型開發紀錄

 


這個模型從無到有訓練兩週 (From Scratch),只用了自己25年來累積的一百多萬張照片訓練,新的模型架構收斂速度快了將近五倍,圖形引導的設計更可以凸顯自己的照片特性,這邊特地挑選了ㄧ些MJ V7的圖片來當目標,重新用當前模型繪製一次,證實當前模型的延展性。從2022年到現在過了三年了,這技術仍然讓人驚奇,這紀錄也鼓勵大家從零訓練是可行的,不需要依賴巨量他人資料或主流非道德模型的使用。希望業界與趨勢能早日走向正軌,尊重原始內容的擁有人,

Friday, April 4, 2025

生成技術的今天與未來

 上篇在Facebook


發文既沒有論文形式,驗證還用了沒有人性生成的形式,沒有任何說服力🤔。最近的熱烈討論,OpenAI推出了吉普力工作室的風格濾鏡,人類史上最強的濾鏡功能,借題發揮了心得。特此附上具備真實意義的符合傳統道德標準開發的純個人圖形模型的訓練過程。因為自己的照片多數是風景,模型生成的自然風景也捕捉了個人風格與偏好。低分辨率沒有加工的。


宮崎駿與 OpenAI (美國公司)


OpenAI 兩年內累積的使用者數量已接近宮崎駿,都高達數億人,但兩者的起點與發展模式截然不同。


面向使用者:

兩者皆直接面向終端使用者。


使用者付費動機:

宮崎駿仰賴視覺藝術與引人入勝的故事情節。

OpenAI 則依賴科技與網路內容的全面訓練(包含宮崎駿的作品),提供圖文生成、無廣告的高級搜尋以及互動體驗。


盈利模式:

宮崎駿的盈利模式為一次性,主要依靠每三年推出一部全新的電影,並銷售周邊商品。

OpenAI 則採用每月 20 美金的訂閱制。


內容取代性:

宮崎駿的形象價值是永續且難以取代的,但其商業模式缺乏持續性,除非不斷推出新作品。

OpenAI 建立的是品牌認知度,其提供的服務若有更優秀的替代方案出現,便會立即被取代。


技術取代性:

宮崎駿的作品,技術取代性極低,因為作品融入了過多個人主觀價值,且技術與其個人風格緊密結合。

OpenAI 技術本身的優勢有限,例如 Deepseek 等公司正在縮小技術差距,但 AI 技術仍需要巨量的人力進行通識標籤與專業標籤。在這方面,OpenAI 的巨量資金不僅在訓練與提供服務上有一定的防護,在服務的完整度上也因為人力資源保持一定優勢。


品牌形象價值:

宮崎駿的形象價值在當代社會體系中不易轉換為實質的商業利益。

OpenAI 的品牌價值,建立在技術突破與資金能直接創造的品牌效應之上,因此經濟實力強盛也能持續保持競爭優勢,但也因此建立起不同的道德標準。


動機:

宮崎駿終其一生是以人為本的創意啟發。

OpenAI 的目標是創造 AGI(通用人工智慧),雖然目前僅有數年時間,但其動機受到各方質疑。


產出內容與法律:

宮崎駿的最終作品,從形象到故事與呈現方式都全面受到法律認可與保護,是成熟的認知與社會價值吻合的形式。

OpenAI 產出的內容仍存在爭議,因為 OpenAI 並未擁有任何原生訓練內容,而是直接訓練全網內容,目前生成內容仍不受到法律保護,除了中國地區,在 2023 年的一個法律訴訟,只要有人為互動,即可自動擁有著作權保護的生成內容。


製作過程的道德與法律:

宮崎駿在員工對待上嚴苛,但整體來說普遍受到敬重,沒有牽涉到任何可能觸犯法律的問題。

OpenAI 未經許可擅自決定訓練全網內容,並偏重高品質內容的輸出,目前正有相當數量的訴訟案件同時發生。


YouTube 的啟示:

YouTube 的崛起受益於盜版內容吸引用戶,如今 OpenAI 採用了同樣未清晰界定的方式,利用全網的知識與藝術內容來生成產出,以擴大用戶規模。YouTube 最終造福了許多人,而 OpenAI 的發展方向仍有待觀察。


2025/04/04 特此紀錄,20年後回顧,我們也會像當初2005,看著社交媒體漸漸擁有我們個人訊息與資料及動向一般。