Skip to content

Latest commit

 

History

History
332 lines (202 loc) · 10.6 KB

SAR-2021-023-LP-v01.md

File metadata and controls

332 lines (202 loc) · 10.6 KB
title subtitle author date output toc-title
Preparo da base de dados de estudo retrospectivo de complicações após artroplastia total de quadril primária em idosos
DOCUMENTO: SAR-2021-023-LP-v01
**De:** Felipe Figueiredo **Para:** Lourenço Peixoto
2022-02-02
html_document pdf_document word_document
fig_caption fig_height fig_width keep_md number_sections toc
true
6
6
true
true
true
number_sections toc
true
true
fig_caption fig_height fig_width reference_docx toc
true
6
6
misc/style_SAR_pt.docx
true
Sumário

\newpage

Preparo da base de dados de estudo retrospectivo de complicações após artroplastia total de quadril primária em idosos

Histórico do documento

Versão Alterações
01 Versão inicial

Lista de abreviaturas

  • ATQ: artroplastia total de quadril
  • FX:
  • TEV: tromboembolismo venoso
  • TEP: tromboembolia pulmonar
  • TVP: trombose venosa profunda
  • ITU:

Contexto

O projeto "Artroplastia total do Quadril em septuagenários, complicações e resultados a curto prazo" identificará ocorrências de complicações após ATQ em pacientes septuagenários quando comparados a pacientes de faixas etárias inferiores. As complicações foram descritas de maneira qualitativa em campo de texto aberto, onde havia a possibilidade de múltiplas observações para um mesmo paciente. Para a análise das ocorrências das complicações, elas precisam ser codificadas como variáveis dicotômicas.

Este relatório técnico descreve como as complicações foram identificadas na base de dados original, em campo de texto aberto, usando expressões regulares.

Objetivos

Limpeza da base de dados e identificação de cada tipo de complicação pós-cirúrgica dos participantes incluídos na base com chaves de busca por expressões regulares.

Recepção e tratamento dos dados

A base de dados original possuía 21 variáveis coletadas de 926 observações. Depois dos procedimentos de limpeza e seleção a base final contava com 38 variáveis de 926 observações. Nenhuma variável foi removida no preparo da base, e a diferença é composta apenas pelas novas variáveis indicadoras criadas para classificar todas as possíveis complicações em cada participante incluído na base. Nenhuma observação foi excluída como parte dos processos de limpeza de dados.

Metodologia

Variáveis

Complicações listadas no projeto

  • tromboembolismo venoso
  • embolia pulmonar
  • anemia com necessidade de transfusão sanguínea
  • distúrbios hidroeletrolíticos com repercussão clínica
  • infecção pós operatória
  • deiscência de ferida
  • instabilidade (luxação aguda ou crônica)

Outras complicações

  • TVP
  • óbito
  • delirium
  • ITU
  • sepse
  • pneumonia
  • FX
  • parestesia

Expressões regulares

Expressões regulares permitem fazer buscas em texto por palavras-chave de forma flexível, permitindo considerar variações de grafia, maiúsculas e minúsculas entre outras coisas. Ao definir chaves de busca específicas para cada complicação, é possível identificar a presença da chave de busca no texto original.

Esta estratégia além de flexível também é expansível e permite ampliar a estratégia de busca que objetiva identificar cada complicação alvo. Na seção 4 serão descritas as chaves de busca usadas para identificação de cada uma das complicações listadas na seção 3.1.

Software utilizado

Esta análise foi realizada utilizando-se o software R versão 4.1.2.

Estratégia de busca

Todas as expressões regulares descritas abaixo foram mapeadas ignorando o caso de grafia, isto é, todas funcionam da mesma forma independente se o texto base foi escrito em maiúsculas ou minúsculas.

Complicações individuais

Anemia com necessidade de transfusão sanguínea

Chaves de busca:

  • anemia

Número de identificações: 18

Embolia pulmonar

Chaves de busca:

  • tep
  • embol

Número de identificações: 2

Tromboembolismo venoso

Chaves de busca:

  • tev

Número de identificações: 0

TVP

Chaves de busca:

  • tvp

Número de identificações: 5

Instabilidade (luxação aguda ou crônica)

Chaves de busca:

  • instab
  • luxa
  • soltura

Número de identificações: 10

Deiscência de ferida

Chaves de busca:

  • deisc

Número de identificações: 2

Infecção pós operatória

Chaves de busca:

  • infec

Número de identificações: 34

Distúrbios hidroeletrolíticos com repercussão clínica

Chaves de busca:

  • hidro
  • eletr[oó]l[íi]t

Número de identificações: 0

Delirium

Chaves de busca:

  • delir

Número de identificações: 5

Óbito

Chaves de busca:

  • [óo]bito
  • morte

Número de identificações: 0

ITU

Chaves de busca:

  • itu

Número de identificações: 4

Sepse

Chaves de busca:

  • s[ée]p[st]

Número de identificações: 1

Pneumonia

Chaves de busca:

  • pneumonia

Número de identificações: 4

FX

Chaves de busca:

  • fx

Número de identificações: 3

Parestesia

Chaves de busca:

  • parest

Número de identificações: 3

Qualquer complicação

A fim de criar um desfecho composto que capturasse o risco de qualquer complicação pós-cirúrgica no curto prazo, foi criada uma nova variável que é positiva se qualquer das complicações identificadas na seção 4.1. Ela é negativa apenas caso nenhuma das complicações individuais tenha ocorrido para aquele paciente.

Número de identificações: 84

Observações e limitações

A estratégia utilizada neste relatório técnico são flexíveis o suficiente para permitir a identificação de informações alvo com diferentes grafias, incluindo acentuação, erros tipográficos típicos entre outros. Adicionalmente, caso novas chaves se mostrem necessárias, elas podem ser facilmente acrescentadas ao algoritmo de busca para ampliar o escopo da identificação.

A principal limitação desta estratégia pode ser identificada na busca de chaves de texto pré-determinadas para identificar informações alvo. A qualidade do resultado depende do estabelecimento prévio de chaves de busca abrangentes, suficientes e adequadas ao texto alvo.

Referências

N/A

Apêndice

Análise exploratória de dados

N/A

Disponibilidade

Este documento pode ser obtido no seguinte endereço:

https://philsf-biostat.github.io/SAR-2021-023-LP/

Dados utilizados

Os dados utilizados neste relatório não podem ser publicados online por questões de sigilo.

prontuario nome sexo data_de_nascimento dia_da_cirurgia dia_de_alta dias_ate_alta colunas4 cid cor idade asa has dm
1
2
3
...
926

Table: Tabela A1 Estrutura da tabela de dados analíticos (continued below)

outras_comorbidades tabagismo ex_tabagista complicacoes lateralidade lateralidade_obs coluna1 comp_anemia comp_tep comp_tev

Table: Table continues below

comp_tvp comp_inst comp_deisc comp_infec comp_hidro comp_delir comp_obito comp_itu comp_sepse comp_pneumo comp_fx

Table: Table continues below

comp_parest comp_qualquer group