Modelo de aprendizagem profunda para a estimativa da pose humana no espaço e no tempo
| AUTHOR | Grinciunaite, Agne |
| PUBLISHER | Edicoes Nosso Conhecimento (06/29/2024) |
| PRODUCT TYPE | Paperback (Paperback) |
Description
Este livro explora as capacidades das redes neuronais convolucionais para lidar com uma tarefa que é facilmente gerível para os humanos: perceber a pose 3D de um corpo humano a partir de vários ângulos. No entanto, na nossa abordagem, estamos limitados à utilização de um sistema de visão monocular. Para este efeito, é aplicada uma abordagem de rede neural convolucional em vídeos RGB e é alargada a convoluções tridimensionais. Isto é feito através da codificação da dimensão temporal nos vídeos como a terceira dimensão no espaço convolucional, e regredindo diretamente para as posições das articulações do corpo humano no espaço de coordenadas 3D. Esta investigação mostra a capacidade de uma rede deste tipo para atingir o desempenho mais avançado no conjunto de dados Human3.6M selecionado, demonstrando assim a possibilidade de representar com êxito dados temporais com uma dimensão adicional na operação convolucional.
Show More
Product Format
Product Details
ISBN-13:
9786207695133
ISBN-10:
6207695135
Binding:
Paperback or Softback (Trade Paperback (Us))
Content Language:
Portuguese
More Product Details
Page Count:
60
Carton Quantity:
118
Product Dimensions:
6.00 x 0.14 x 9.00 inches
Weight:
0.22 pound(s)
Country of Origin:
US
Subject Information
BISAC Categories
Computers | General
Descriptions, Reviews, Etc.
publisher marketing
Este livro explora as capacidades das redes neuronais convolucionais para lidar com uma tarefa que é facilmente gerível para os humanos: perceber a pose 3D de um corpo humano a partir de vários ângulos. No entanto, na nossa abordagem, estamos limitados à utilização de um sistema de visão monocular. Para este efeito, é aplicada uma abordagem de rede neural convolucional em vídeos RGB e é alargada a convoluções tridimensionais. Isto é feito através da codificação da dimensão temporal nos vídeos como a terceira dimensão no espaço convolucional, e regredindo diretamente para as posições das articulações do corpo humano no espaço de coordenadas 3D. Esta investigação mostra a capacidade de uma rede deste tipo para atingir o desempenho mais avançado no conjunto de dados Human3.6M selecionado, demonstrando assim a possibilidade de representar com êxito dados temporais com uma dimensão adicional na operação convolucional.
Show More
List Price $38.00
Your Price
$37.62
