Dicas para lidar com JSON no SQL Server

Como pessoas desenvolvedoras, algumas vezes iremos nos deparar com tabelas grandes, seja de um sistema legado ou não. Uma estratégia bastante comum é armazenar documentos JSON através de colunas VARCHAR ou NVARCHAR.

A partir do SQL Server 2016 , foram adicionadas as funções JSON, permitindo combinar os conceitos de NoSQL e relacional no mesmo banco de dados.

O objetivo deste artigo é compartilhar algumas dicas que podem ser úteis no seu dia a dia. Devo ressaltar que cada ferramenta resolve um problema específico, então caso sua necessidade seja armazenar documentos com alta performance, o uso de um banco de dados NoSQL pode ser mais adequado.

Construindo e filtrando informações em uma tabela de integração

Vamos imaginar que ficamos responsáveis por extrair e filtrar algumas informações de uma grande tabela de integração. À primeira vista parece algo trivial, mas ao fazer o primeiro SELECT descobrimos que a tabela possui milhares ou até milhões de linhas.

Para nosso experimento, vamos criar uma tabela temporária a partir da declaração:

Imagem com uma instrução SQL criando uma tabela temporária com o nome “Pessoas” com as colunas Id e JSON. CREATE TABLE #Pessoas (Id INT NOT NULL IDENTITY PRIMARY KEY, JSON NVARCHAR(MAX))

E em seguida adicionar as duas estruturas JSON abaixo:

Imagem dividida em colunas representando duas estruturas JSON com as propriedades Nome, idade e habilidades

Imagem contendo a declaração SQL para inserir ambas as estruturas JSON na tabela #Pessoas.

Como resultado teremos duas linhas, representando as pessoas e suas habilidades:

Imagem com o resultado SQL de duas linhas inseridas, cada uma representando uma das estruturas JSON citadas anteriormente.

Nosso primeiro objetivo é filtrar todas as pessoas com nome “Kim”. Talvez a primeira ação que venha à mente seja utilizar o operador LIKE, entretanto, essa estratégia não é muito performática para cenários específico, como o nosso exemplo.

A forma mais simples de atingir esse objetivo é utilizar a função JSON_VALUE:

Imagem representando o uso da função JSON_VALUE no MSSQL.

O primeiro parâmetro é a coluna com o documento JSON. Já no segundo parâmetro, devemos informar a propriedade na forma hierárquica que queremos pesquisar.

Dado o exemplo anterior, podemos utilizar a instrução SQL abaixo:

Imagem com uma única instrução “SELECT” na tabela pessoas e filtrando o nome “KIM” com a função JSON_VALUE. SELECT * FROM #Pessoas WHERE JSON_VALUE(JSON, ‘$.nome’) = ‘Kim’

Como resultado, teremos uma única linha com as informações de “Kim”:

Imagem com o resultado SQL do SELECT anterior, representando uma única linha onde o nome é “KIM”

Podemos filtrar até mesmo quais pessoas possuem tais habilidades, como por exemplo: “culinária”. Nesse caso, utilizaremos a função OPENJSON, que analisa um texto JSON e retorna os objetos e propriedades como linhas e colunas.

Imagem com uma instrução SQL filtrando as pessoas que possuem a habilidade de culinária. SELECT * FROM #Pessoas WHERE 'culinária' IN (SELECT value FROM OPENJSON([JSON], '$.habilidades'))

Imagem com o resultado SQL do SELECT anterior, representando uma única linha onde o nome é “KIM”

Simples, não?

Agora vamos imaginar que nossa tabela possui milhares ou até mesmo milhões de linhas. Será que a nossa query está rápida suficiente? Apesar de existirem estratégias focadas em otimizações, as vezes precisamos de algo mais simples e rápido para resolver um problema pontual.

Segundo a documentação oficial do MSSQL, os Índices de bancos de dados servem para melhorar o desempenho das operações de filtragem e classificação. Sem índices, o SQL Server precisaria executar uma verificação de tabela completa sempre que você precisar consultar os dados.

Até o momento, não é possível fazer referências diretamente a propriedades em documentos JSON. Portanto, precisamos criar uma “coluna virtual” que retorne os valores para utilizarmos em nosso filtro.

Uma abordagem bastante interessante é a criação de colunas computadas. Por padrão, essas colunas “não existem” e serão calculadas a partir da nossa coluna JSON.

Imagem com a instrução SQL para criar uma coluna computada com a descrição “nome”. ALTER TABLE #Pessoas ADD Nome AS JSON_VALUE(JSON, ‘$.nome’)

Em seguida, podemos criar nosso índice baseado na coluna “Nome”

Imagem com a instrução SQL para criar um índice na coluna computada “Nome”. CREATE INDEX IDX_Nome ON #Pessoas (Nome)

Perceba que o MSSQL adicionou uma nova coluna apontando para a propriedade “nome”. Dessa forma, podemos aplicar o filtro diretamente na coluna “nome”, tornando nossa instrução SQL mais simples.

Imagem contendo o resultado SQL com a nova coluna computada de descrição “Nome”

Imagem contendo a instrução SQL para filtrar o nome “Ariel” a partir da nova coluna computada. SELECT * FROM #Pessoas WHERE Nome = ‘Ariel’

Imagem contendo o resultado SQL com apenas uma única linha onde o nome é “Ariel”

Caso o texto contido na coluna JSON for alterado, a coluna “nome” refletirá o valor atualizado automaticamente.

Imagem contendo a instrução SQL para atualizar a pessoa com nome “Kim” e Id igual a 2. A propriedade nome foi atualizada com o valor “Sol”, a idade 18 com as habilidades natação, poemas e karatê.

Imagem contendo o resultado SQL com o nome atualizado de “Kim” para “Sol”

Conclusão

As funções JSON apresentadas neste artigo podem ser bastante úteis no nosso dia a dia, resolvendo cenários ao qual desejamos mais performance e simplicidade.

Fabio Martinelli

Paulista, desenvolvedor de softwares e baixista nas horas vagas. Sou graduado em Análise e Desenvolvimento de Sistemas, Engenharia de Redes e atualmente sou Microsoft MCP. Acredito na tecnologia como principal ferramenta de transformação, apoiando o ser humano na construção de soluções para os problemas da humanidade.

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	Este cookie é definido pelo consentimento do cookie LGPD para registrar o consentimento do usuário para os cookies na categoria "Funcional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Cookie	Duração	Descrição
_ga	3 horas	Este é um cookie do Google Analytics.
_ga_Z8V3TYDNCJ	2 anos	Este é um cookie do Google Analytics.

Dicas para lidar com JSON no SQL Server

Construindo e filtrando informações em uma tabela de integração

Conclusão

tags

Fabio Martinelli

Mais postagens...

Lambda3 Podcast 426 – Segurança no desenvolvimento de frontends modernos

Lambda3 Podcast 424 – De onde vem as pessoas especialistas de IA?

Assine nossa Newsletter