Bölüm 6 — Eğitim Yapılandırması

JSON olarak dışa aktarılmış ve TextEdit'te görüntülenmiş Preview önayarı — id/name/category/version/createdAt/description alanları, tüm ilgili parametrelerle trainingConfig (maxIterations 5000, densifyUntilIteration 3500, ssimWeight 0.20, renderScale 0.50, strategy classic, cameraAlignment applePhotogrammetry, densifyGradThreshold 2.0e-06, opacityResetInterval 3000, minOpacity 0.005, altı bool anahtar)

Tipik bir önayar JSON dışa aktarması. Üst düzey alanlar: id (UUID), name, (classic | mcmc | sceneClass | custom), (şema sürümü), (zaman damgası), (serbest metin). İç içe nesne yeniden üretilebilirlik için kritik parametreleri içerir — içe aktarmada tüm blok TrainingConfig yapısına deserialize edilir ve uygulama sürümünün varsayılanları JSON'da eksik alanları doldurur (ör. uygulama güncellemesinden sonra). Bir önayarı başka bir Mac'e aktarmak isteyen, bu JSON dosyasını basitçe gönderir.

TrainingConfig yapısı RadianceKit'teki her eğitim çalıştırmasının kalbidir. Eğitimi etkileyen her parametreyi toplar — maksimum iterasyon sayısından sekiz öğrenme hızına ve MCMC, Mip-Splatting, müfredat ve sahne farkındalıklı üst sınır mantığı için özel alanlara kadar. Bunu kenar çubuğunda Eğitim Yapılandırması bölümü alanında (Expert View) düzenler, bir önayar olarak kaydeder veya başka bir Mac'e JSON dışa aktarımı olarak iletirsin. Eğitim sırasında tam olarak bu nesne dondurulur ve GPU arka ucuna iletilir.

Bu bölüm güç kullanıcıları ve script yazarları için referans malzemesidir. Tüm 81 herkese açık alanı, 9 statik önayarı ve tek herkese açık yöntemi listeler. Kaynak dosya TrainingConfig.swift'dir — şüphede orada saklanan doc yorumu ve başlatıcı varsayılanı tek doğruluk kaynağıdır.

İçindekiler:

+ İterasyon (T1–T2) + Öğrenme hızları (T3–T10) + Densification — Classic (T11–T16) + Loss (T17–T20) + SH derece ilerlemesi (T21) + Performans (T22–T25) + Tanı ve nokta bulutu hazırlığı (T26–T30) + Düzenleme (T31–T37) + İnce ayar (T38–T44) + Sky-Dome (T45–T48) + Adam + LR programı (T49–T55) + Son işleme + Apple AI (T56–T60) + MCMC Densification (T61–T73) + Mip-Splatting (Q1.5) (T74–T76) + Uyarlanabilir Densification (Q5) (T77–T79) + Müfredat (Q6) (T80–T81) + Statik önayarlar (TP1–TP9) + Yöntem: + Hangi alan ne için? (kopya kağıdı) + Tehlikeli alanlar

İterasyon (T1–T2)

T1maxIterations

DETAYLAR

Varsayılan: 30 000 (inizializzatore), 35 000 (.full), 200 000 (.fullMCMC) Range: 1 000 – 500 000 (slider UI), nessun limite superiore rigido nella logica Tanımlandığı yer:

TEKNİK

Numero totale di iterazioni di training che il backend esegue. Un'iterazione indica un forward render di una singola fotocamera di training, un backward pass su tutti i componenti di loss (L1 + SSIM + regolarizzazioni opzionali + sky mask) e uno step Adam optimizer. Questo numero agisce direttamente sugli altri schedule: la learning rate di posizione segue una curva di cosine annealing da 0 fino o a T1 stesso o a T49 positionLRScheduleEndIteration; la densification si ferma a T2 densifyUntilIteration; il decadimento del rumore MCMC termina a T69 mcmcNoiseDecayEnd; gli upgrade del grado SH avvengono ai tre marker definiti in T21. Con densification classica il sweet spot determinato empiricamente è 20 000–35 000 iterazioni (sessioni 1–32, test V546), con MCMC 60 000–200 000 (V534). Un aumento drastico oltre i valori memorizzati nel preset raramente porta qualità aggiuntiva — l'Adam momentum satura, e senza fine del LR decay il loss ristagna. Viceversa, scendere sotto ~5 000 porta a geometrie convergenti in modo incompleto (il density control ha troppo poco tempo per clone/split).

T2densifyUntilIteration

DETAYLAR

Varsayılan: 15 000 (inizializzatore), 5 000 (.full), 160 000 (.fullMCMC) Range: 0 – Tanımlandığı yer:

TEKNİK

Iterazione a partire dalla quale la densification si ferma. Fino a qui le gaussiane vengono clonate, divise e prune secondo le regole parametrizzate in T11–T16 (Classic) o T67–T70 (MCMC); dopo il numero di gaussiane rimane costante e solo posizioni, rotazioni, scale, opacità e coefficienti SH vengono ottimizzati (fase di refinement). Nel paper 3DGS originale il valore è al 50% di T1, nel preset .full di RadianceKit solo a ~14% (5 000 su 35 000) — conseguenza degli esperimenti V310/V338, che hanno mostrato che dopo 5 000 iterazioni un'ulteriore densificazione peggiora piuttosto il risultato (più floater, più memoria, nessun guadagno di qualità). MCMC invece esegue la rilocazione fino all'80% di T1 (V504b), perché MCMC non produce floater dannosi. Se T2 è troppo piccolo (< 1 000), nascono troppe poche gaussiane; troppo grande con Classic (> 50% di T1) porta a overgrowth e RGB saturation outlier (vedi findings di outdoor overtraining).

Varsayılan: false (inizializzatore e tutti i preset) Range: boolean Tanımlandığı yer:

TEKNİK

Attiva il Sky Masking. In ogni immagine la regione del cielo viene mascherata via Apple Vision Framework (VNGenerateForegroundInstanceMaskRequest), e il loss in quest'area viene impostato a zero. Senso: le scene outdoor soffrono spesso del fatto che pixel di cielo blu/grigi/bianchi portano l'app a posizionare gaussiane esattamente lì — ciò che viene percepito come "floater". Senza sky mask il loss in quest'area non sarebbe mai zero, perché il cielo nell'immagine varia leggermente e l'app cerca all'infinito di ricostruirlo con splat. La maschera Vision viene calcolata una volta per fotocamera prima del training e mantenuta in RAM. Tipicamente attivata insieme a T45 skyDomeEnabled (logica UI nella view Impostazioni). Con scene interne o rendering sintetici lasciare disabilitato — la maschera riconoscerebbe erroneamente soffitti o pareti come "cielo".

SH derece ilerlemesi (T21)

T21shDegreeUpgradeIterations

DETAYLAR

T45skyDomeEnabled

DETAYLAR

Varsayılan: false (inizializzatore + tutti i preset eccetto P9 Outdoor) Range: boolean Tanımlandığı yer:

TEKNİK

Funzione V549e: prima dell'avvio del training viene generata una nuvola di punti sferica (sfera di Fibonacci con T46 sample point), posizionata in un raggio di T47 skyDomeRadiusMultiplier × scene_extent attorno al centro della scena e inizializzata con i colori dei pixel mascherati come cielo di tutte le fotocamere di training (vedi T20 skyMaskingEnabled). Queste gaussiane sky dome vengono inserite all'inizio del buffer gaussiano e "congelate" durante il training (gradienti posizione/scala/rotazione = 0, solo SH e opacità rimangono ottimizzabili). Effetto: invece di aree "confetti" nere in lontananza, l'utente vede in novel view un cielo reale. MVP V549e funziona molto bene su scene di drone e paesaggio; in P9 Outdoor preset default on. Con scene interne lasciare off — la sfera penderebbe inutile fuori dalla stanza.

T46skyDomeSampleCount

DETAYLAR

Varsayılan: 5 000 Range: 1 000 – 50 000 (tipico 2 000 – 10 000) Tanımlandığı yer:

TEKNİK

Numero di sample point della sfera di Fibonacci sulla sfera sky dome. Valori più alti → sky dome più denso (migliore con grandi risoluzioni e molto cielo visibile), ma più fabbisogno di memoria. 5 000 è sweet spot per rendering 4K; con risoluzioni più basse 2 000–3 000 basta. I punti vengono inizializzati per cosine distance a ogni vettore di vista delle fotocamere di training con i corrispondenti pixel mascherati come cielo — i sample point il cui view cone non vede alcuna fotocamera rimangono indietro con un basso valore iniziale di opacità, ma non vengono modificati durante il training (congelati).

T47skyDomeRadiusMultiplier

DETAYLAR

Varsayılan: 30.0 (inizializzatore + la maggior parte dei preset), 59.0 (P9 Outdoor, ottimo Q7-BayesOpt) Range: 5.0 – 200.0 Tanımlandığı yer:

TEKNİK

Raggio della sfera sky dome relativo all'estensione della scena (= distanza media tra posizioni delle fotocamere). 30 = la sfera ha 30 volte il diametro della nuvola della fotocamera. Troppo piccolo (< 5) → lo sky dome interferisce con la scena stessa (ad es. uno splat sky dome finisce in primo piano); troppo grande (> 100) → perdita di precisione float32 sulle posizioni sky dome, il che provoca glitch di rendering in lontananza. Q7-BayesOpt su Bicycle (Mip-NeRF 360) ha trovato 59.0 come ottimo specifico per scena outdoor — ciò indica che lo standard 30.0 è troppo piccolo per paesaggi profondi e i pixel sky dome nelle aree di bordo immagine renderizzano visibilmente come "parete".

T48frozenGaussianCount

DETAYLAR

Stato: Q1.5 il 2026-05-25 dopo 14 iterazioni autonome + overnight 1.5M confidence check è stato scartato come "closed no-win" (max Δ@2× = +0.27 dB, il gate originale richiedeva ≥ +1.5 dB di media su 0.5×/2×, FALLISCE su 0/11 pair scenes). I campi rimangono opt-in per esperimenti di ricerca; tutti i preset di produzione hanno. Vedi verdetto: docs/plans/2026-05-25-phase-q1.5-final-verdict.md.

T74useMipSplatting

DETAYLAR

Varsayılan: false (tutti i preset di produzione), true (.fullMCMCMip — sibling di ricerca) Range: boolean Tanımlandığı yer:

TEKNİK

Attiva Mip-Splatting (Yu et al. CVPR 2024): filtro di smoothing 3D + filtro 2D + compensazione α, che limita la frequenza per gaussiana al limite di Nyquist della densità di campionamento più alta della fotocamera di training. Obiettivo teorico: eliminazione dell'aliasing al rendering in scale fuori training (0.5× o 2× della risoluzione di training). Attivato negli shader di preprocess e backward projection, funzionalmente verificato corretto nel test Q1.5-D. Ma: il gate di accettazione originale (Δ@1× ≥ +0.3 dB E avg(Δ@0.5×, Δ@2×) ≥ +1.5 dB) non è stato raggiunto su nessuna delle 11 pair scenes. Massimo osservato: family 750K classic Δ@2× = +0.270 dB. Le scene outdoor (Truck, Flowers) hanno mostrato addirittura peggioramento 1× e 0.5×. Ipotesi: lo smoothing 3D compete con la rilocazione MCMC con high-Gs. Il campo rimane per future re-eval multi-scala con metodologia Mip-NeRF-360 corretta (vedi O3-backlog nel benchmark path).

T75mipSmoothing3DScale

DETAYLAR

Varsayılan: 0.2 (default paper) Range: 0.05 – 1.0 Tanımlandığı yer:

TEKNİK

Parametro di scala di smoothing 3D (Yu et al. §3.3, default paper 0.2). Più grande = più smoothing spazio mondo per gaussiana (= più antialiasing, ma anche più blur nella scala di default), più piccolo = più nitido ma più suscettibile all'aliasing. Viene consultato solo se T74 useMipSplatting = true. Nei test Q1.5 non ulteriormente ottimizzato — il gate A/B ha già perso con default paper 0.2, ulteriori sweep sarebbero inutili.

T76mipFilter2DVariance

DETAYLAR

T80curriculumResolutionRamp

DETAYLAR

Varsayılan: false Range: boolean Tanımlandığı yer:

TEKNİK

Funzione Q6: la risoluzione di training inizia a 0.5× e cambia a T50 positionLRScheduleEndIteration / 2 (o T1 maxIterations / 2, se T50 non è impostato) a T22 trainingRenderScale. Usa l'infrastruttura resize/restoreImageBuffers sviluppata in Q1.5.1. Sovrascrive T23 resolutionWarmupScale se attivato. Q6 è passato come "portatore del guadagno di qualità" nel bundle Q5+Q6 (vedi T77) — l'aumento graduale di risoluzione dà all'app tempo di trovare geometria grossolana sulla risoluzione più bassa, prima di passare al lavoro di dettaglio fine. Via CLI: –curriculum-resolution.

T81curriculumSHProgression

DETAYLAR

Varsayılan: false Range: boolean Tanımlandığı yer:

TEKNİK

Funzione Q6: sovrascrive T21 shDegreeUpgradeIterations con [maxIter/4, maxIter/2, maxIter*3/4], distribuisce quindi gli upgrade SH uniformemente sul tempo di training invece di caricarli sul fronte. Ipotesi: la geometria stabile viene stabilita prima dell'esplosione del color detail, il che posiziona più precisamente gli effetti di luce dipendenti dalla direzione di vista. Q5+Q6 insieme PASS 1/3 scene, Q6 come portatore del guadagno (Q5 alone FAIL). Via CLI: –curriculum-sh.

Signature: public func resolveMcmcMaxGaussians(initialPointCount: Int, bufferCapacity: Int) -> Int Tanımlandığı yer:

Unica fonte di verità per la domanda "quante gaussiane MCMC può far crescere al massimo?". Si calcola da tre input: il T62 mcmcMaxGaussians configurato (con floor mass extinction 150 000, se 0), il (numero di punti SfM init) e la (dimensione del buffer gaussiano pre-allocato). Logica:

+ base = T62 > 0 ? T62: 150_000 (il floor mass extinction protegge contro bug di default dell'inizializzatore come l'incidente mass extinction 1.4.3) + Se T73 mcmcAutoScaleByScene && initialPointCount > 0 && T72 mcmcCapMultiplier > 0: - scaled = max(base, ceil(initialPointCount × T72)) altrimenti

+ Se bufferCapacity > 0: return min(scaled, bufferCapacity) + Altrimenti return scaled

Esempio: Bicycle (Mip-NeRF 360, 194 foto-frame) → SfM-init ~156 K punti, T62 = 150 000, T72 = 5.32, capacità buffer 8 M. Resolved cap = min(8M, max(150K, ceil(156K × 5.32))) = min(8M, 830K) = 830 K. È il cap di crescita effettivo a cui si attiene la logica di rilocazione MCMC.

Calcola il vero numero massimo di splat con MCMC. Prende la tua impostazione, guarda quanti punti ha la tua scena all'inizio, e scala con il Multiplier se l'adattamento automatico è on. Così il cap si adatta alla scena, invece di forzare lo stesso valore per una scena piccola e una enorme. Non devi chiamare il metodo tu stesso — il training lo usa internamente.

Hangi alan ne için? (kopya kağıdı)

Obiettivo	Campi da regolare
Più dettaglio in lontananza	`T62 mcmcMaxGaussians` alto, `T72 mcmcCapMultiplier` 5+
Più dettaglio in generale (Classic)	`T1 maxIterations` alto (≤ 40K), `T2 densifyUntilIteration` ≤ 14% di T1
Ridurre floater nei voli di drone	`T43 frustumCullEnabled` on, `T20 skyMaskingEnabled` on, `T45 skyDomeEnabled` on
Bel cielo in scene esterne	`T45 skyDomeEnabled` on, `T47 skyDomeRadiusMultiplier` 30–60
File di export più piccolo	Strategia `.mcmc` (T61), `T56 postTrainingCompactification` on, `T62 mcmcMaxGaussians` ≤ 200K
Training più veloce	`T22 trainingRenderScale` 0.5, `T1 maxIterations` dimezzare — ma non entrambi!
Migliori luci speculari	`T21 shDegreeUpgradeIterations` con `[2K, 5K, 8K]` (nessun early front load), MCMC + 200K iter
Mantenere il Mac reattivo	`T25 throttleDelayMs` 5–10 (costa ~15% di tempo training)
Live preview più frequente	`T59 livePreviewInterval` giù a 10–20
Transizioni più morbide alle ombre	`T17 ssimWeight` un po' alto (0.15–0.25), ma non oltre 0.3
Mantenere interni compatti	Preset P10 Indoor (, `T72 = 1.76`)

Tehlikeli alanlar

Questi campi con configurazione errata possono portare a OOM, crash dell'app, mass extinction delle gaussiane o dati benchmark inutilizzabili. Da trattare con cautela:

- T11 densifyGradThreshold — un dimezzamento può generare 2–4× più gaussiane, il che fa rapidamente esplodere la memoria GPU. Da considerare anche: deve corrispondere a T22 trainingRenderScale (1.0× → 1e-6, 0.5× → 2e-6, 0.25× → 4e-6). - T72 mcmcCapMultiplier — con scene grandi con > 200 K punti SfM-init e multiplier > 5 nasce un cap risolto di milioni di gaussiane. Su Mac da 36 GB di RAM OOM possibile. Il 5.32 del preset Outdoor funziona solo perché Mip-NeRF-360 Bicycle ha 156 K punti init → 830 K cap. - T39 testViewIndices — l'impostazione manuale può rendere il benchmark inutilizzabile (tutti gli indici > N → nessun holdout). Lascia che il flag –benchmark lo imposti. - T64 mcmcOpacityRegWeight e T65 mcmcScaleRegWeight — nella 1.4.3 beta impostati a 0.01, il che ha portato a mass extinction (460 K → 5 gaussiane in un'iterazione). Dalla 1.4.4 fissato a 0.0, ma l'aumento manuale può riprodurre il problema. - T15 opacityResetInterval — se non 100 000+ (effettivamente off) e il training è più breve di 10 000 iterazioni, il reset distrugge la convergenza. .preview ce l'ha quindi su 100 000 nonostante maxIterations = 5 000. - T54/T55 densifyPhase2* — la densification a due fasi è stata interrotta nei test in 0-gaussian cascade. Lascia entrambi a 0. - T74 useMipSplatting — Q1.5 closed-no-win 2026-05-25, può addirittura peggiorare il PSNR su alcune scene outdoor. Default off, opt-in solo per ricerca.

Se un campo è in questa lista e vuoi modificarlo, fai prima un backup del tuo preset attuale (export come JSON) e considera se puoi misurare in modo riproducibile il risultato — altrimenti dopo non sai se hai prodotto un miglioramento o un peggioramento.