Metodología

El marco común a las tres estrategias. Los detalles propios de cada una están en su página dedicada.

Un test histórico puede mentir. Con suficientes parámetros ajustables, siempre se encuentra una combinación que da un historial brillante sobre datos pasados: es la trampa del sobreajuste. El verdadero desafío es separar las estrategias que tienen alguna posibilidad de funcionar en el futuro de aquellas que simplemente tuvieron suerte sobre el historial.

Calibración congelada, observación en tiempo real

Cada estrategia muestra una fecha de calibración en lo alto de su página. Más allá de esa fecha, no se modifica ningún parámetro: todo lo que ocurre después se observa en condiciones reales. A esa zona la llamamos «fuera de muestra» (OOS). Es la que realmente valida la estrategia, frente al periodo «dentro de muestra» en el que se afinaron las reglas.

Una estrategia que supera el índice dentro de muestra pero decepciona fuera de muestra está probablemente sobreajustada a los datos pasados. Es el principal riesgo de los tests históricos. La rentabilidad mostrada aquí yuxtapone ambos periodos, de modo que ustedes puedan juzgar por sí mismos.

Disciplina SPX & Gold

SPX & Gold es la pieza central del dispositivo: es la que pilota la asignación entre renta variable, oro y renta fija. Lógicamente, también es la que se ha sometido a la batería más completa de salvaguardas. Nueve tests estadísticos independientes apuntan cada uno a una forma específica de sobreajuste. Ningún mecanismo se adopta hasta que no los ha superado todos.

Validación cruzada anidada. En lugar de evaluar la rentabilidad sobre el conjunto de datos (que se utilizó para elegir los parámetros), se divide el historial en cinco periodos independientes. Para cada periodo, la estrategia se ajusta sobre los otros cuatro y se evalúa a ciegas sobre este. La rentabilidad reportada es el promedio de las cinco evaluaciones a ciegas, no el mejor ajuste.
Evaluación condicional a regímenes de crisis. Una estrategia protectora del riesgo debe mostrar su ventaja durante las crisis, no solo en promedio. La rentabilidad se mide por separado en cinco regímenes de estrés históricos (burbuja puntocom 2000-2002, crisis financiera 2007-2009, volatilidad del cuarto trimestre de 2018, COVID primer trimestre de 2020, mercado bajista de 2022). Para superar la validación, al menos cuatro de los cinco regímenes deben mostrar mejor rentabilidad frente a un índice de referencia pasivo.
Costes de transacción incluidos. Toda la rentabilidad mostrada incluye un modelo de coste de cinco puntos básicos por ida y vuelta, ponderado por la tasa de rotación efectiva. Evita optimizar una estrategia que ya no se sostiene una vez aplicados los gastos reales de corretaje.
Corrección de comparaciones múltiples. Cuando se prueban cientos de candidatos, algunos superarán los umbrales estadísticos por puro azar. El procedimiento Romano-Wolf step-down controla el family-wise error rate al 5 %: la probabilidad de aceptar siquiera un único falso positivo sobre el conjunto de teorías queda limitada al 5 %.
Test sobre múltiples ventanas fuera de muestra. La candidata debe rendir sobre ocho ventanas fuera de muestra deslizantes no solapadas (2003 → hoy, desfasadas dieciocho meses). Evita el sobreajuste a un único periodo fuera de muestra: si la estrategia solo se sostiene en una o dos de esas ventanas, queda rechazada.
Test «leave-one-crash-out» (LOCO). Para cada crisis histórica, la estrategia se reentrena excluyendo esa crisis específica del conjunto de entrenamiento, y luego se evalúa a ciegas sobre la ventana excluida. Si la rentabilidad se mantiene sobre crisis no vistas, eso es prueba directa de que la estrategia no está sobreajustada a las cinco crisis específicas conocidas.
Verificación cruzada sobre cuatro índices extranjeros. Las mismas señales se aplican a cuatro índices extranjeros (Reino Unido, Alemania, Francia, Japón). Si la estrategia se sostiene en mercados que nunca vio durante la calibración, es una señal fuerte de que los mecanismos capturan un fenómeno económico general y no una particularidad del S&P 500.
Sondas anti-sobreajuste independientes. Varios tests de diagnóstico se ejecutan en paralelo al proceso principal, por ejemplo generando candidatos sin acceso a las fechas de las crisis históricas conocidas. Si las conclusiones divergen entre las sondas y el proceso principal, el mecanismo se considera sospechoso.
Modo ciego frente a modo canónico. La mitad de las teorías candidatas se generan sin referencia a periodos históricos nombrados (modo «ciego»), la otra mitad con acceso completo. Si ambos conjuntos convergen sobre mecanismos similares, es una señal fuerte de que la estrategia captura un fenómeno económico real y no un patrón ad hoc.

Disciplina Acciones

La estrategia Acciones no se apoya en un backtest paramétrico sino en análisis fundamental, valor por valor. El rigor procede de un perímetro estrecho, de una separación estricta de las etapas de análisis, y de un cuestionamiento continuo. Estas son las principales salvaguardas.

Perímetro definido. La selección se concentra en las grandes capitalizaciones estadounidenses (capitalización bursátil superior a 2.000 millones de dólares). Sin medianas ni pequeñas capitalizaciones, sin valores fuera de Estados Unidos, sin mercados emergentes. Este perímetro garantiza liquidez, transparencia contable y un universo suficientemente profundo para analizar a fondo.
Cuatro vías de análisis separadas. Cada valor se evalúa en cuatro temas distintos: calidad del negocio, valoración, riesgos y catalizadores, condiciones de falsación. Cada evaluación se produce con independencia de las demás para mantener juicios no contaminados. Una etapa de consolidación arbitra después.
Calidad del negocio evaluada sin conocer el precio. La etapa que juzga la calidad del negocio ignora explícitamente el precio del valor, la capitalización bursátil y todos los ratios de mercado (PER, P/FCF, EV/EBITDA). Separa «¿es bueno este negocio?» de «¿está a un precio razonable?». Impide que un precio elevado racionalice un negocio mediocre, o que un precio bajo enmascare un negocio en declive.
Doble evaluación de valores bajo presión temática. Cuando un valor está expuesto a una tendencia desfavorable (sustitución tecnológica, disrupción sectorial), la calidad del negocio se evalúa dos veces: primero sin conocer la presión, luego conociéndola. La brecha entre ambas notas mide la robustez real del negocio frente a la amenaza, con independencia de la intuición narrativa.
Recomendaciones por triangulación. Cuando llega el momento de actuar, se producen dos revisiones paralelas con objetivos opuestos: una sobre las compras potenciales ignorando las posiciones actuales (evita justificar a posteriori lo que ya se posee), la otra revisando cada posición mantenida según criterios estrictos de protección del capital. Una etapa de síntesis arbitra después los conflictos, sin poder invadir el perímetro de ninguna de las dos revisiones.
Condiciones de falsación explícitas. Cada expediente enumera condiciones cuantificadas que invalidarían su tesis (por ejemplo: «si el crecimiento de los ingresos cae por debajo del 10 % interanual»). Estas condiciones se vuelven a contrastar periódicamente, de forma automática, sobre las cifras recientes. Esta disciplina evita los sesgos de racionalización a posteriori sobre las posiciones mantenidas.
Reauditoría condicional y requalificación automática. Los expedientes cuyas cifras ya no cuadran con el análisis inicial se reexaminan sistemáticamente. Un mecanismo automático también relee periódicamente los valores previamente descartados: si aparecen señales positivas convergentes (reanudación del crecimiento, retorno a la rentabilidad, recuperación de márgenes), el expediente se reabre. Sin favoritismos, sin olvidos voluntarios.

Disciplina Bitcoin

Esta estrategia se apoya en un mecanismo central cuya calidad solo emerge con el paso del tiempo y mediante el ensayo de variantes. La disciplina consiste en someter este mecanismo a distintas ventanas temporales, medir la degradación cuando se retira un componente, y rastrear cuántas alternativas se han probado sin éxito.

Mecanismo centrado en la noción de bandas. El motor de decisión se apoya principalmente en bandas de tendencia adaptativas que siguen el precio y determinan las entradas y salidas. Todo lo demás (filtros macro, umbrales de salida) se injerta alrededor de este esqueleto.
Validación walk-forward sobre 11 ventanas. La estrategia se reevalúa sobre 11 ventanas deslizantes independientes (24 meses de entrenamiento, 6 meses de test). Una modificación debe mejorar el rendimiento acumulado Y mantenerse estable en al menos el 55 % de esas ventanas para ser adoptada.
Tests de ablación sistemáticos. Cada componente macro injertado en la estrategia se ha probado retirándolo individualmente. Todos degradan los resultados al ser retirados. Cada componente queda por tanto justificado por su contribución medida.
Más de 300 variantes probadas. Se han probado más de 300 variantes sobre hiperparámetros, filtros, salidas, marcos temporales y otros ajustes. Ninguna sobrevive a la validación de estabilidad walk-forward. La parametrización actual es un óptimo local robusto, no el mejor ajuste de una búsqueda exhaustiva.
Validación con doble motor. Dos implementaciones independientes del motor de decisión funcionan en paralelo. Ninguna modificación se adopta hasta que ambos motores convergen sobre las mismas señales. Las divergencias señalan un bug o un artefacto numérico antes de que contaminen una decisión.

Lo que estas estrategias NO son

No son day-trading ni scalping. Las posiciones duran típicamente varias semanas a varios meses.
Sin apalancamiento, sin ventas en corto, sin opciones, sin margen. Solo compras y ventas al contado.
Sin predicciones macro de corto plazo. Ninguna posición se toma especulando sobre la próxima decisión de un banco central o sobre un dato macro próximo a publicarse.
Sin «receta secreta» oculta. El método se articula abiertamente, sin revelar los parámetros exactos que constituyen la ventaja competitiva.
No es una garantía de rentabilidad. Son resultados históricos publicados con transparencia, no una promesa sobre el futuro.
Sin consejo personalizado, sin optimización fiscal. Este sitio presenta estrategias y sus resultados públicos, no recomendaciones adaptadas a su situación.