Skip to content
/ app Public

Análise do Impacto da Padronização de Markdown na Carga Cognitiva e Desempenho de Tarefas

License

Notifications You must be signed in to change notification settings

moemd/app

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Este notebook investiga como a padronização da linguagem markdown afeta a carga cognitiva e o desempenho em tarefas quando utilizando diferentes modelos generativos. Utilizando dados sintéticos, o notebook simula um cenário onde desenvolvedores empregam diferentes LLMs (Large Language Models) com e sem markdown padronizado em suas rotinas diárias.

Fluxo de Trabalho

O notebook segue uma metodologia estruturada dividida em cinco etapas principais:

  1. Carregamento e Validação de Dados: Carrega dados sintéticos e valida sua estrutura para garantir integridade.
  2. Pré-processamento de Dados: Aplica escalonamento MinMax nas características numéricas.
  3. Visualização de Dados: Gera gráficos KDE e Violin para comparar distribuições.
  4. Análise Estatística: Realiza análise bootstrap para calcular intervalos de confiança.
  5. Relatório de Insights de LLM: Sintetiza descobertas utilizando LLMs simulados (Grok, Claude, Grok-Enhanced).

Recursos Técnicos

O notebook implementa diversas técnicas avançadas:

  • Processamento de Dados: Utiliza pandas para manipulação e validação de estruturas de dados.
  • Visualização Estatística: Emprega seaborn para gráficos KDE e Violin plots com estilo personalizado.
  • Análise Estatística Robusta: Implementa métodos bootstrap para estimar intervalos de confiança.
  • Simulação de Agente DDQN: Inclui uma classe de agente Double Deep Q-Network simplificada para demonstração.
  • Integração de Múltiplos LLMs: Simula a análise de dados por diferentes modelos generativos.

Estrutura do Código

O notebook está organizado nas seguintes seções:

  • Importações e Configurações: Configura bibliotecas e parâmetros globais.
  • Implementação do Agente DDQN: Define uma classe simplificada para demonstração.
  • Funções Auxiliares: Contém utilidades para:
    • Validação e carregamento de dados
    • Criação de visualizações
    • Análise estatística
    • Integração com LLMs simulados
  • Script Principal: Executa o fluxo de trabalho completo e gera relatórios.

Conjuntos de Dados

O notebook utiliza um conjunto de dados sintéticos que contém:

  • IDs de desenvolvedor
  • Tipos de modelo (Modelo A, Modelo B)
  • Status de padronização de markdown (0/1)
  • Métricas de carga cognitiva (escala de 0-10)
  • Métricas de desempenho de tarefas (escala de 0-100)

Saídas

O notebook gera as seguintes saídas:

  • Gráficos KDE: Mostram a distribuição de carga cognitiva e desempenho de tarefas com e sem padronização.
  • Gráficos Violin: Visualizam a distribuição de métricas por status de padronização.
  • Estatísticas Resumidas: Incluem médias, desvios padrão e intervalos de confiança bootstrap.
  • Relatório de Insights: Combina análises simuladas de Grok-base, Claude 3.7 e Grok-Enhanced.

Requisitos

Para executar este notebook, são necessárias as seguintes bibliotecas:

  • pandas
  • matplotlib
  • seaborn
  • numpy
  • scikit-learn
  • scipy

Como Usar

  1. Clone este repositório
  2. Instale as dependências necessárias
  3. Execute o notebook completo ou seções individuais
  4. Verifique os resultados na pasta de saída especificada

Conclusões Principais

A análise sugere que a padronização de markdown leva a:

  • Redução estatisticamente significativa na carga cognitiva dos desenvolvedores
  • Aumento correspondente no desempenho de tarefas
  • Benefícios consistentes em diferentes modelos generativos

Estas conclusões indicam que o uso consistente de markdown pode melhorar a eficiência do desenvolvedor e reduzir o esforço mental necessário quando trabalhando com diferentes LLMs.

Autor

Hélio Craveiro Pessoa Júnior