Este notebook de estudos realiza uma análise detalhada de propriedades na cidade de São Paulo utilizando dados de abril de 2019. A análise inclui desde a limpeza dos dados até a otimização de modelos preditivos para estimativa de preços de imóveis.
- Importação das bibliotecas necessárias.
- Carregamento do dataset de propriedades.
- Separação dos dados de propriedades para aluguel e venda.
- Criação de mapas de dispersão para propriedades de aluguel baseados em preço e tamanho.
- Exibição de estatísticas descritivas e histogramas das variáveis principais.
- Contagem da frequência de tipos de propriedades e análise de correlação entre variáveis.
- Remoção de colunas desnecessárias e exibição do dataframe limpo.
- Codificação da coluna de distritos utilizando OrdinalEncoder e OneHotEncoder.
- Separação dos dados em variáveis dependentes e independentes e divisão em conjuntos de treinamento e teste.
- Treinamento e avaliação do modelo de regressão linear.
- Treinamento e avaliação do modelo de árvore de decisão.
- Realização de validação cruzada no modelo de árvore de decisão.
- Realização de validação cruzada no modelo de regressão linear.
- Treinamento do modelo de regressão de floresta aleatória.
- Avaliação do modelo de floresta aleatória utilizando validação cruzada.
- Otimização dos hiperparâmetros do modelo de floresta aleatória utilizando GridSearchCV.
- Exibição dos melhores parâmetros e estimador encontrados pelo GridSearchCV.
- Avaliação final do modelo otimizado utilizando o conjunto de teste.