Back to Search

Modelo de aprendizagem profunda para a estimativa da pose humana no espaço e no tempo

AUTHOR Grinciunaite, Agne
PUBLISHER Edicoes Nosso Conhecimento (06/29/2024)
PRODUCT TYPE Paperback (Paperback)

Description
Este livro explora as capacidades das redes neuronais convolucionais para lidar com uma tarefa que é facilmente gerível para os humanos: perceber a pose 3D de um corpo humano a partir de vários ângulos. No entanto, na nossa abordagem, estamos limitados à utilização de um sistema de visão monocular. Para este efeito, é aplicada uma abordagem de rede neural convolucional em vídeos RGB e é alargada a convoluções tridimensionais. Isto é feito através da codificação da dimensão temporal nos vídeos como a terceira dimensão no espaço convolucional, e regredindo diretamente para as posições das articulações do corpo humano no espaço de coordenadas 3D. Esta investigação mostra a capacidade de uma rede deste tipo para atingir o desempenho mais avançado no conjunto de dados Human3.6M selecionado, demonstrando assim a possibilidade de representar com êxito dados temporais com uma dimensão adicional na operação convolucional.
Show More
Product Format
Product Details
ISBN-13: 9786207695133
ISBN-10: 6207695135
Binding: Paperback or Softback (Trade Paperback (Us))
Content Language: Portuguese
More Product Details
Page Count: 60
Carton Quantity: 118
Product Dimensions: 6.00 x 0.14 x 9.00 inches
Weight: 0.22 pound(s)
Country of Origin: US
Subject Information
BISAC Categories
Computers | General
Descriptions, Reviews, Etc.
publisher marketing
Este livro explora as capacidades das redes neuronais convolucionais para lidar com uma tarefa que é facilmente gerível para os humanos: perceber a pose 3D de um corpo humano a partir de vários ângulos. No entanto, na nossa abordagem, estamos limitados à utilização de um sistema de visão monocular. Para este efeito, é aplicada uma abordagem de rede neural convolucional em vídeos RGB e é alargada a convoluções tridimensionais. Isto é feito através da codificação da dimensão temporal nos vídeos como a terceira dimensão no espaço convolucional, e regredindo diretamente para as posições das articulações do corpo humano no espaço de coordenadas 3D. Esta investigação mostra a capacidade de uma rede deste tipo para atingir o desempenho mais avançado no conjunto de dados Human3.6M selecionado, demonstrando assim a possibilidade de representar com êxito dados temporais com uma dimensão adicional na operação convolucional.
Show More
List Price $38.00
Your Price  $37.62
Paperback