En los cubos OLAP, las dimensiones representan las variables, categorías o atributos que definen los datos almacenados, estás dimensiones permiten organizar y estructurar la información en el cubo, proporcionando un marco para realizar análisis multidimensionales
Es cierto o falso? | Cierto |
Que observas en la imagen? | Estructura XML |
Elemento XML que en conjunto permite crear un cubo para realizar análisis | <schema>, <cube>, <physicalSchema> |
“Base de datos multidimensional basada en arreglos que hace posible procesar y analizar múltiples dimensiones de datos de manera mucho más rápida y eficiente que una base de datos relacional tradicional” | Cubo OLAP |
En el análisis del diseño de los cubos, ¿cuáles son los puntos importantes? | *Hechos: Actividad objeto del análisis
*Indicadores: Métricas o variables a analizar
*Dimensiones: Perspectiva de análisis |
En el caso de SVM lineal, la ecuación que define el hiperplano es: | w⋅x+b=0 |
Requisitos para el diseño de los cubos OLAP | Requerimientos
Análisis
Determinar Jerarquías de dimensiones
Diseño multidimensional |
En el caso de SVM lineal, la ecuación que define el hiperplano es: | w⋅x+b=0 |
¿Cuál es el objetivo principal de SVM? | Es maximizar el margen entre las clases y minimizar los errores de clasificación |
En el caso de SVM lineal, la ecuación que define el hiperplano es... | w⋅x+b=0 |
¿Cuáles son Los tipos de servidores en los cubos? | OLAP-ROLAP:Está basado en los modelos relacionales DBMS.
OLAP-MOLAP: Está basado en DBMS multidimensionales para su almacenamiento y acceso a los datos. |
¿Cuál es el objetivo principal de SVM? | Es maximizar el margen entre las clases y minimizar el error de clasificación |
El proceso de Minería de Datos de esta metodología se compone de las siguientes etapas: - Muestreo - Exploración - Modificación - Modelado - Evaluación (Valoración) | Metodología SEMMA |
Pregunta audio | Bits |
¿Cómo se puede expresar el problema de construir un árbol de decisión | Recursivamente |
¿Cómo se llama la medida de impureza que se usa en un árbol de decisión? | Información |
¿Cuál es el primer paso que se debe de hacer en Spoon? | Hacer una conexión a la base de datos Origen y a la Destino |
¿Cuál es la metodología a seguir para la creación de cubos OLAP? | Metodología |
Se le conoce como... | Transformación |
¿Para qué se definen los dos tipos de elementos: Transformations y Jobs en Spoon? | Se define Transformations para transformar los datos,
describiendo flujos de datos para ETL.
Se definen Jobs para organizar tareas y transformaciones
estableciendo su orden y condiciones de ejecución |
¿Qué representa? | Las etapas del proceso de Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery in Databases, KDD) |
Con la imagen nos referimos a... | La Metodología CRISP-DM |
¿Cuáles con las actividades de la etapa de Procesamiento de Datos en el KDD? (Knowledge Discovery in Databases, KDD) | Las actividades de esta etapa son: - Limpieza de datos (data cleaning) - Transformación de los datos - Reducción de dimensionalidad |
Usa el enfoque de divide y vencerás | Árboles de decisión |
Límite de decisión que separa puntos de datos en diferentes clases en un espacio de alta dimensión | Hiperplano |
¿Qué significa SVM por sus siglas en inglés? | Support Vector Machine |
¿Cuáles son las diferencias entre OLTP y OLAP? | OLTP es un sistema de modificación de datos online, mientras que OLAP es un sistema de recuperación de datos multidimensionales históricos en línea |
¿Cuál es el término para esta definición? | Bagging |
¿Qué representa la imagen? | Bosque aleatorio |
¿Cómo se define un boque aleatorio? | Conjunto de árboles de decisión dónde cada árbol se entrena en una muestra aleatoria de datos y contribuye a la predicción final |
¿Cómo se decide la predicción final en los bosques aleatorios? | Para clasificación: Votación
Para regresión: Promedio |
¿Qué es la minería de datos? | Técnicas para el descubrimiento automatizado eficiente de patrones previamente desconocidos, válidos, novedosos, útiles y comprensibles en grandes bases de datos. |
¿A qué se refiere la siguiente imagen? | Proceso de la minería de datos |
Técnica de la minería de datos | Modelado predictivo |
Técnica que se basa en el concepto de agrupación de datos y se incluye en el aprendizaje no supervisado, donde los datos no están etiquetados. | Segmentación de bases de datos |
¿Cuál es la estructura de una función en R y describe brevemente cada una de sus partes ? | Entradas o argumentos: sirven para ingresar información
Cuerpo: está formado por un conjunto de instrucciones
Salidas: son los resultados de la función. Toda función debe tener al menos un
resultado. |
Tu cliente que en este caso es una escuela privada te pide analizar su base de datos, al comenzar de lo primero que te percatas es que gay un campo que posee valores categóricos lo que significa que esos valores no están ordenados, qué harías para que ese campo sea útil a la hora de extraerlo y usarlo en un algoritmo | Utilizar la funcion revalue y con ello reemplaza valores en la variable dada en la entrada x, de acuerdo con las reglas dadas en la entrada de reemplazo. |
¿De que tipo es la siguiente grafica? | Gráficos de barras con una superposición de respuesta para explorar la relación entre un predictor categórico. |
El cliente o el analista pueden no tener nociones a priori destacadas sobre
lo que los datos podrían revelar. En tales casos,¿Qué es lo que le permite hacer el análisis exploratorio de datos (EDA) o el análisis gráfico de datos? | Gráficas para explorar la relación entre las variables predictoras y la variable objetivo |
¿Qué es un árbol de decisión? | crea modelos de regresión o clasificación en forma de estructura
de árbol. |
En los árboles de decisión, ¿para qué se utiliza está fórmula? | La desviación estándar se utiliza para calcular la homogeneidad de una muestra numérica. |
¿Cuáles son algunas métricas comunes utilizadas para evaluar la calidad de los modelos de regresión? | R-squared
MSE
MAE
RMSE |
En la matriz de confusión, ¿qué representan los verdaderos positivos? | Esto representa casos que se pronostican como Sí y en realidad, los casos son Sí. |
El resultado a predecir no es una clase discreta sino una cantidad numerica | Predicción numérica |
Sirve para identificar patrones que permiten explorar las propiedades de los datos | Modelo descriptivo |