起源に関しては、ヒューマンビートボックスの概念規定によって諸説が混交としていたが、近年では適切な捉え方[7]が進んでいる。例えば、ヒューマンビートボックスはストリートカルチャーが発祥であるという前提に立つならば、アメリカ合衆国で1930年代に出現した簡易な楽器とボーカルによるドゥーワップが始まりとなり、1985年にDoug E.Freshは自身が1982年に最初にこの音楽表現を始めた[8]と語っており、「La Di Da Di」が最古の録音と捉えることができる。[9] 一方、The Fat Boys(1982~1991,2008~)のメンバーの一人Buffyは、1975年に始めたと主張[10]している。ただし、両者の主張は録音録画に基づくものではなく、あくまでも元祖を主張する二人という捉え方をすべきである。
なお、ボーカル・パーカッションとヒューマンビートボックスは、どちらも既存の楽器の音を模倣した言語音を使ったり、直接的模倣音を使ったりするため、日本国内ではこれらが混同される場合が少なくない。特に、日本においては、ア・カペラ・グループの演奏を競い合うテレビ番組[15]の中で、「ボイス・パーカッション」(正しくは、ボーカル・パーカッション)という呼称やその表現が先行して広まったこともあり、ボーカル・パーカッションとヒューマンビートボックスが定義の上で混用される例も多い。しかし、ヒューマンビートボックスの世界大会である、BEATBOX BATTLE WORLD CHAMPIONSHIPなどの場に於いては、ボイス・パーカッションという呼称は理解されないことも多く、日本におけるボイス・パーカッションの概念は、海外ではボーカル・パーカッションあるいは、ヒューマンビートボックスとして理解されている。[3]