Guia do Usuário

Capítulo 7 — Predefinições de qualidade embutidas

Seção de predefinições com os três grupos — CLASSIC (4 presets: Quick/Preview/Balanced/Quality), MCMC (3 presets, expandido com aviso „No threshold tuning”), SCENE CLASS (3 presets, ajustados por Bayes da Fase Q7)
Seção de predefinições com os três grupos — CLASSIC (4 presets: Quick/Preview/Balanced/Quality), MCMC (3 presets, expandido com aviso „No threshold tuning"), SCENE CLASS (3 presets, ajustados por Bayes da Fase Q7)

Seção de predefinições no Inspetor, todos os três grupos principais visíveis. Grupo CLASSIC expandido com Quick (1K iters), Preview (5K iters, seleção ativa com check azul), Balanced (20K iters), Quality (35K iters). Grupo MCMC recolhido com badge „3" (três presets dentro) e subtítulo „No threshold tuning" — MCMC dispensa threshold de densify-until. SCENE CLASS recolhido com badge „3" para os três auto-presets ajustados na Q7 (Render/3D, Outdoor, Indoor). Linha de ações no rodapé: Save…, Export…, Import…

Uma predefinição (preset) é uma configuração pronta para o treinamento. O RadianceKit traz dez predefinições embutidas — sete clássicas para cenas padrão e três „Scene Class" (P8–P10), ajustadas na Fase Q7 com otimização bayesiana contra cenas reais Mip-NeRF 360 e NeRF-Blender. Você as escolhe na sidebar na área Presets ou no Modo Iniciante durante o import. Os botões + abrem diálogos para criar suas próprias predefinições ao lado — as dez embutidas não podem ser apagadas, mas podem ser duplicadas.

No Expert View as predefinições aparecem agrupadas por estratégia (Classic / MCMC / Scene-Class). Um clique numa entrada grava a configuração de treinamento armazenada no estado atual. Isso não é um snapshot — se você depois mexer nos controles, o estado muda, mas a predefinição em si permanece inalterada; um aviso colorido então mostra „modified".

Qual predefinição é a certa em cada momento depende sobretudo do tipo de cena e do hardware. As três tabelas no fim do capítulo resumem isso.

P1 — Quick

ONDE

Inspetor → Seção de predefinições → Grupo „Classic" → entrada „Quick". Sufixo de UUID …001.

TÉCNICO

Predefinição de diagnóstico com 1 000 iterações, estratégia clássica (adaptativa) de densification e uma escala de resolução de treinamento de 0.25× (imagem de entrada é reduzida a 25 % antes do treinamento). Não pretende entregar uma cena final, mas rapidamente verificar se o setup (poses de câmera, nuvem de pontos, série de imagens) mostra movimento útil nos valores de loss. Em um M3 Ultra tipicamente menos de 30 segundos em 50–200 imagens. A resolução pequena disfarça a qualidade real de imagem, mas mantém o consumo de memória e o custo de render bem baixos. Também é escolhida automaticamente como padrão no primeiro início se o sistema tiver menos de 10 GB de RAM.

P2 — Preview (Classic)

ONDE

Inspetor → Seção de predefinições → Grupo „Classic" → entrada „Preview". Sufixo de UUID …002.

TÉCNICO

5 000 iterações de densification clássica, escala de resolução 0.5×, taxas de aprendizado duplicadas em relação ao padrão. A densification (clone + split) fica ativa nas primeiras 2 500 iterações, depois somente pruning. Predefinição padrão para sistemas com ≥ 10 GB de RAM. Em um M3 Ultra tipicamente 90 segundos a 3 minutos para uma cena de 200 imagens. Entrega uma impressão útil da geometria e da pose da câmera, mas as texturas ficam visivelmente suavizadas — a resolução de 0.5× não pode ser contornada diretamente treinando depois com P3 ou P4, porque as taxas de aprendizado estão calibradas para meia resolução.

P3 — Balanced (Classic)

ONDE

Inspetor → Seção de predefinições → Grupo „Classic" → entrada „Balanced". Sufixo de UUID …005.

TÉCNICO

20 000 iterações de densification clássica em resolução de imagem total. A densification roda nas primeiras 15 000 iterações; a partir da iter 3 000 com intervalo de densify de 100. Empiricamente o „sweet spot" das sessões de treinamento documentadas: com densification clássica em Horse Full e Truck o L1-loss estabiliza entre as iters 18 000 e 22 000; treinar mais que isso, abaixo de Quality (P4), não traz melhora significativa. Em um M3 Ultra tipicamente 30–60 segundos em 200 imagens, 5–8 minutos em 1 000+ imagens.

P4 — Quality (Classic)

ONDE

Inspetor → Seção de predefinições → Grupo „Classic" → entrada „Quality". Sufixo de UUID …003.

TÉCNICO

35 000 iterações de densification clássica com V546-„Opacity Decay" (HTGS, Eurographics 2025): após cada ciclo de densify, a opacidade de todos os Gaussians existentes é multiplicada por um fator < 1.0, o que remove com confiabilidade Gaussians que ficaram inativos durante o pruning, alcançando assim um L1-loss 14 % melhor que a corrida clássica de 35 000 iters com o mesmo número de iterações. SSIM-loss está ativo (ssimWeight=0.05). Em um M3 Ultra tipicamente 2–4 minutos em 200 imagens. Em NeRF-Blender (Lego, Chair, Drums) entrega L1 final ≈ 0.023 — melhor variante Classic nos 560+ experimentos documentados. Atenção: precisa de ~3–5 GB de memória de GPU; em sistemas com 8 GB, P3 é a escolha segura.

P5 — Preview (MCMC)

ONDE

Inspetor → Seção de predefinições → Grupo „MCMC" → entrada „Preview". Sufixo de UUID …006.

TÉCNICO

60 000 iterações de densification MCMC (3DGS-MCMC, NeurIPS 2024) com cap de 100 000 Gaussians. MCMC substitui a lógica heurística de clone/split por relocação Markov-chain Monte-Carlo: Gaussians mortos são reposicionados por profundidades de amostragem ponderadas por sigmoide, o que produz uma quantidade controlada e reproduzível de Gaussians. O cap limita o número máximo de forma dura em 100K — economiza memória e tempo de render, mas custa detalhe. Em um M3 Ultra tipicamente 5–8 minutos em 200 imagens. Adequada como „teste de funcionamento MCMC" — ajuda a julgar se trocar de Classic para MCMC faz sentido, antes de você investir mais tempo em P6 ou P7.

P6 — Balanced (MCMC)

ONDE

Inspetor → Seção de predefinições → Grupo „MCMC" → entrada „Balanced". Sufixo de UUID …007.

TÉCNICO

120 000 iterações MCMC com cap de 150 000 Gaussians. O nível intermediário do MCMC — quase o número final de Gaussians de P7 Quality, mas só 60 % das iterações. Empiricamente o L1-loss nas sessões de treinamento documentadas fica em 0.026–0.028 em Horse Full, contra 0.0246 do P7 — ou seja, cerca de 7 % mais alto, com metade do tempo de espera. Em um M3 Ultra tipicamente 8–15 minutos em 200 imagens. Usa um método que escala o cap efetivo de Gaussians de acordo com a densidade de pontos da nuvem SfM de entrada (ver T75 no Capítulo 6).

P7 — Quality (MCMC)

ONDE

Inspetor → Seção de predefinições → Grupo „MCMC" → entrada „Quality". Sufixo de UUID …004.

TÉCNICO

200 000 iterações MCMC com cap de 150 000 Gaussians, SSIM-loss 0.05, decaimento de noise MCMC ao longo de 80 % das iterações. Melhor L1 single-run nos 560+-experimentos: 0.0238 em Horse Full; média de 3 trials 0.0246 (contra 0.0230 do P4 na mesma cena). O MCMC entrega ainda 71 % menos Gaussians (150K vs ~524K) — decisivo se você quer publicar o resultado na web, porque a nuvem menor produz arquivos de export bem menores. Tempo de treinamento em um M3 Ultra tipicamente 20–35 minutos em 200 imagens; em sets de 1 000+ imagens, mais perto de 1–2 horas. Melhor escolha quando se busca máxima qualidade de imagem com tamanho final mínimo.

Grupo SCENE CLASS expandido com os três presets — Render (3D) 200K iters / 1 189K Gs, Outdoor (tuned) 200K iters / 1 250K Gs, Indoor 200K iters / 669K Gs
Grupo SCENE CLASS expandido com os três presets — Render (3D) 200K iters / 1 189K Gs, Outdoor (tuned) 200K iters / 1 250K Gs, Indoor 200K iters / 669K Gs

Inspetor com o grupo SCENE CLASS expandido. Cada entrada de predefinição lista nome, orçamento de iterações e cap final de Gaussians. Os caps altos (669K a 1.25M) refletem os tunings da BayesOpt da Q7, que determinaram empiricamente a densidade ótima de Gaussians para cada tipo de cena. A seleção por clique grava a configuração de treinamento armazenada no estado atual.

P8 — Render (3D)

ONDE

Inspetor → Seção de predefinições → Grupo „Scene-Class" → entrada „Render (3D)". Sufixo de UUID …700.

TÉCNICO

Predefinição Scene Class para cenas sintéticas / tipo CGI (NeRF-Blender, Mip-NeRF 360 Flowers, sets de teste renderizados em Blender). O sweep Q7-BayesOpt (Trial T10 em flowers, Seed 7, Budget 20) determinou: mcmcMaxGaussians=1 189 511, mcmcCapMultiplier=2.98, ssimWeight=0.051, densifyGradThreshold=3.34e-06, mcmcNoiseScale=5.61e-05. Δ +0.36 dB de PSNR contra a baseline Quality-MCMC (17.67 → 18.03). O Mip-Splatting é deliberadamente desligado (veredito Q1.5 „closed no-win" de 2026-05-25), assim como o Sky Dome (cenas sintéticas não têm céu real). A principal alavanca é o limite 8× maior de Gaussians — cenas sintéticas com alpha limpo e texturas densas reagem muito a densidade mais alta. Tempo de treinamento em 200 imagens aproximadamente igual ao P7.

P9 — Outdoor (tuned)

ONDE

Inspetor → Seção de predefinições → Grupo „Scene-Class" → entrada „Outdoor (tuned)". Sufixo de UUID …701.

TÉCNICO

Predefinição Scene Class para tomadas externas com céu real e grande faixa de profundidade (Mip-NeRF 360 Bicycle/Garden, ETH3D-Tunnel, voos de drone). O sweep Q7-BayesOpt (Trial T0 em bicycle, Seed 7, Budget 10) determinou: mcmcMaxGaussians=1 250 744, mcmcCapMultiplier=5.32, ssimWeight=0.082, skyDomeRadiusMultiplier=59.0. Δ +1.40 dB de PSNR contra Quality-MCMC (21.66 → 23.06) — todos os 9 trials válidos em bicycle ultrapassaram o limiar de +1.0 dB. Cenas externas reagem extremamente bem a orçamentos maiores de Gaussians (faixa de profundidade escalada) e ao Sky Dome V549e (pixels de céu projetados em torno da cena de forma esférica). Multiplicador de cap 5.32 permite à relocação MCMC amostrar de forma mais agressiva em regiões distantes da imagem. Mip-Splatting deliberadamente desligado (veredito Q1.5: chega a custar PSNR em outdoor). Recomendação na UI com o sufixo „(tuned)" — contra a contraparte indoor sem otimização, o salto de qualidade é mais de quatro vezes maior.

P10 — Indoor

ONDE

Inspetor → Seção de predefinições → Grupo „Scene-Class" → entrada „Indoor". Sufixo de UUID …702.

TÉCNICO

Predefinição Scene Class para ambientes internos (Mip-NeRF 360 Bonsai/Kitchen/Room, Deep Blending playroom/drjohnson, ETH3D Storage Room). O sweep Q7-BayesOpt (Trial T6 em bonsai, Seed 7, Budget 8) determinou: mcmcMaxGaussians=669 215, mcmcCapMultiplier=1.76, densifyGradThreshold=1.67e-06, pruneOpacityThreshold=0.0142, ssimWeight=0.171. Δ +0.33 dB de PSNR contra Quality-MCMC (29.63 → 29.96). 3/8 trials passaram o limiar de +0.2 dB; 8/8 válidos (sem stall graças ao stall-guard de mtime). Ambientes internos reagem cerca da metade do que outdoor — Δ +0.33 vs +1.40 dB — com aproximadamente metade do orçamento de Gaussians (670K vs 1.25M). O motivo: a geometria limitada por paredes satura mais cedo; mais Gaussians acabam desperdiçados em superfícies planas de parede. Multiplicador de cap 1.76 é escolhido de forma conservadora para evitar collapse de MCMC (fenômeno da v1.4.3). Sky Dome e Mip-Splatting ambos desligados.

Qual predefinição, quando?

CenárioTeste inicialCorrida principal
Teste de funcionamento de imagens novas, < 30sP1 Quick
Scan de objeto único, < 500 fotosP2 PreviewP4 Quality ou P7 MCMC
Ambiente interno, 100–500 fotosP2 ou P5P10 Indoor
Externo / drone / paisagem, > 200 fotosP5 Preview MCMCP9 Outdoor (tuned)
Renderizações Blender/Cinema 4D, set NeRF-BlenderP5 Preview MCMCP8 Render (3D)
Distribuição na web (pequeno, compacto)P2P7 Quality MCMC (arquivo menor com qualidade plena)
Impressão, marketing, detalhe plenoP3 ou P5P4 Quality (Classic)

Comparação rápida

PresetEstratégiaItersMax-GsEscala de renderTempo típico (200 imagens, M3 Ultra)Q-Sweep
P1 QuickClassic1 0000.25×~30 s
P2 PreviewClassic5 0000.5×2–3 min
P3 BalancedClassic20 0001.0×30–60 s
P4 QualityClassic35 0001.0×2–4 minV546 HTGS
P5 Preview MCMCMCMC60 000100 K1.0×5–8 min
P6 Balanced MCMCMCMC120 000150 K1.0×8–15 min
P7 Quality MCMCMCMC200 000150 K1.0×20–35 minV544a
P8 Render (3D)MCMC200 0001.19 M1.0×25–45 minQ7 T10 Δ+0.36 dB
P9 Outdoor (tuned)MCMC200 0001.25 M1.0×30–50 minQ7 T0 Δ+1.40 dB
P10 IndoorMCMC200 000670 K1.0×25–40 minQ7 T6 Δ+0.33 dB

Predefinições próprias

Pelo botão Save… na seção de predefinições (I1 no Capítulo 2), você salva a configuração de treinamento atual como uma predefinição própria. Predefinições próprias não são „Built-in" e podem ser renomeadas, exportadas (como JSON), compartilhadas por arrastar/soltar, duplicadas e apagadas. As dez predefinições embutidas P1–P10 ficam intocadas pelo botão de apagar.

Regra prática: se você muda algo numa predefinição que quiser usar com mais frequência — Sky Dome ligado, peso de SSIM maior para uma certa classe de cena, número de iters diferente —, salve a variante como predefinição própria. Assim, na próxima corrida você já sabe que é uma configuração diferente do padrão.