Podstawy - Ogólne pojęcia dotyczące dźwięku

Jest to ogólne wprowadzenie do kluczowych koncepcji audio dla tych, którzy wcześniej nie pracowali z dźwiękiem. Jeśli klasyfikujesz się jako "audiofil", lub jeśli masz inne doświadczenia z przeszłości, aby dowiedzieć się o dźwięku, możesz pominąć tę stronę.

Dźwięku

Punktem wyjścia dla wszystkiego, co robi WavePad, jest dźwięk. Dźwięk wibruje powietrze podróżujące bardzo szybko jak fala. Jest tworzony przez obiekt wibracyjny (np. nasze struny głosowe, struny gitarowe lub głośnik) i może być wykryty przez ucho lub mikrofon. Mikrofon przekształca te wibracje w naprzemienne napięcie elektroniczne, które karta dźwiękowa komputera może przekształcić w dane używane przez WavePad.

Częstotliwości

Jednym ze sposobów analizy dźwięku jest spojrzenie na prędkość, z jaką wibruje podczas podróży w powietrzu. Liczba takich drgań na sekundę nazywana jest "częstotliwością" dźwięku i jest mierzona w Hertz (Hz) lub kiloHertz (kHz).

Często zdarza się, że dźwięki nie będą składać się z pojedynczej fali wibrującej z określoną częstotliwością w powietrzu, często będą zawierać wiele fal wibrujących przy różnych prędkościach i różnych poziomach głośności. WavePad zawiera kilka narzędzi, które pozwolą Ci zobaczyć ten efekt dla siebie, zobacz Analiza częstotliwości (FFT i TFFT) aby uzyskać więcej informacji.

Mówi się, że ludzkie ucho jest w stanie słyszeć dźwięki od około 20 Hz (20 wibracji na sekundę) do 20 000 Hz (20 000 wibracji na sekundę). W rzeczywistości większość z nas słyszy tylko około 15 000 Hz, ale entuzjaści dźwięku często twierdzą, że słyszą dźwięki do znaku 20 000 Hz. Częstotliwości głosu danej osoby mogą wynosić od 300 Hz do 3000 Hz.

Głośność, głośność, amplituda, poziom i wzmocnienie

Terminy głośność, głośność, amplituda i poziom oznaczają mniej więcej to samo. Im większa głośność dźwięku, tym więcej mocy zostało użyte do jego utworzenia i tym głośniej brzmi.

Podczas regulacji poziomu głośności dźwięku (na przykład podczas korzystania z efektu wzmocnienia wavepada) wartość "Gain" oznacza stopień zwiększenia lub spadku poziomu. Wartość ta może być reprezentowana w procentach lub w skali zwanej skalą "decybel" lub "dB" (czytaj dalej!).

Ludzkie ucho może usłyszeć niezwykle szeroki zakres dźwięków od bardzo niskiej do bardzo dużej mocy. Ucho nie dostrzega różnic w mocy w bezpośredniej proporcji do mocy, ale w sposób logarytmiczny. Aby lepiej dopasować sposób, w jaki słyszymy dźwięk, inżynierowie używają skali decybeli (dB). Aby dać ci poczucie, jak to działa, zmniejszenie poziomu głośności dźwięku o 6dB oznacza, że spada amplituda o 1/2 lub moc o 1/4. Z drugiej strony, wzrost poziomu o 6dB odpowiada podwojeniu amplitudy. Spadek 20dB oznacza 1/10 amplitudy (lub 1/100 mocy). Najmniejsza jednostka zmiany głośności osoba zauważy jest około + / - 3dB.

Nagrywanie dźwięku i komputery

Aby przechowywać i odtwarzać dźwięk na komputerze, sygnał audio z mikrofonu jest konwertowany przez kartę dźwiękową na serię numerów w krótkim odstępie czasu. Można myśleć o tych liczbach jako reprezentujących nacisk na powierzchni mikrofonu w różnych punktach w czasie. Ten proces przekształcania dźwięku w serię liczby nazywa się "sampling".

Częstotliwość próbkowania

Częstotliwość próbkowania jest liczbą konwersji amplitudy na liczbę na sekundę. Na przykład przy nagrywaniu jakości dysku CD komputer przechowuje 44100 liczb na sekundę, z których każdy reprezentuje amplitudę w określonym punkcie w czasie.

Można wykazać, że maksymalna możliwa częstotliwość, jaką można przenosić w próbkowym dźwięku, stanowi dokładnie połowę częstotliwości próbkowania. W rzeczywistości jest to trochę mniej. Na przykład nagranie wykonane z częstotliwością próbkowania 44100 będzie przenosić częstotliwości do 20000Hz.

Krótki przewodnik po cenach próbek jest następujący:

6000 - Bardzo niskiej jakości głos
8000 - Telefon jakości głosu
11025 - Rozsądna jakość głosu - np.
22050 - Dobrej jakości głos, Muzyka rozsądnej jakości - np.
44100 - Jakość płyty CD.

Wyższe częstotliwość próbkowania, w tym 48000, 88200, 96000, a nawet 192000, są czasami używane, ale wielu inżynierów dźwięku zwraca uwagę, że nie oferują one żadnej rzeczywistej poprawy jakości dźwiękowej (oprócz dodania nieco większej redundancji do systemu).

Wskazówka: zawsze nagrywaj i pracuj z dźwiękiem w próbce, której będziesz używać w końcu, ponieważ za każdym razem, gdy konwertujesz, tracisz trochę jakości. Na przykład - jeśli robisz cd używać 44100. Jeśli jest do użytku telefonicznego 8000.

Kanały Stereo / Mono

Wiele "kanałów" dźwięku może być nagrywanych w tym samym czasie. Najczęściej nagranie "Stereo" to dwa kanały (lewe i prawe), za pomocą których nasze dwa uszy dają nam poczucie kierunku dźwięku i przestrzeni. Nagrywanie tylko z jednym kanałem jest określane jako nagranie "Mono".

Wskazówka: Jeśli nagrywasz głos, pamiętaj o nagrywaniu w trybie Mono. Jeśli nagrywasz muzykę z wieloma instrumentami, użyj trybu Stereo.

8/16/24/32 bity

Być może podczas patrzenia na pliki dźwiękowe widziałeś terminy takie jak "8 bitów" lub "16 bitów", ale nie masz pewności, co one oznaczają. Liczba bitów, podobnie jak w próbce, jest wskaźnikiem jakości lub rozdzielczości dźwięku wewnątrz pliku. Im więcej bitów, tym lepsza rozdzielczość. WavePad wykorzystuje 32 bity wewnętrznie dla optymalnej jakości dźwięku. Jednak 16 bitów jest zwykle więcej niż wystarczające do zaoszczędzenia.

Kompresja plików audio i kodeki

Jednym z problemów z wysokiej jakości dźwiękiem jest to, że możesz skończyć z bardzo dużymi plikami audio. Aby tego uniknąć, można użyć tak zwanej "kompresji", aby zmniejszyć rozmiar plików. Systemy używane do implementacji kompresji w plikach audio są nazywane "kodeków".

Istnieje wiele różnych kodeków wokół, w tym MPEG Layer-3/MP3, Ogg Vorbis (zarówno dobre dla muzyki) i GSM (dobre dla telefonu lub głosu). Większość kodeków jest przeznaczona dla określonej funkcji, zwykle do przechowywania muzyki lub głosu.

Koder-dekodownik kompresji można wybrać podczas korzystania z opcji Plik -> Zapisz jako w wavepadie. Należy pamiętać, że prawie wszystkie kodeki kompresji są stratne, jednak - oznacza to, że tracisz jakość dźwięku za każdym razem, gdy zapisujesz plik. Z tego powodu ważne jest, aby nie zapisywać dźwięku w skompresowanej formie, dopóki nie jest naprawdę potrzebny. Na przykład, jeśli chcesz zapisać plik, gdy chcesz wykonać dalszą pracę nad nim, zapisz go w nieskompresowanej formie, takiej jak 44100 Hz, 16-bitowy format PCM Wave.

Kompresji plików audio nie należy mylić z kompresją zakresu dynamiki dźwięku. Kompresja plików polega na zmniejszeniu rozmiaru pliku, podczas gdy kompresja zakresu dynamicznego polega na regulacji głośności. Aby uzyskać więcej informacji na temat kompresji zakresu dynamicznego, zobacz Efekty.

Edycja i efekty

Edycja oznacza usuwanie lub wstawianie dźwięku. Efekty to procesy, które w jakiś sposób zmieniają dźwięk (np. dodaj echo lub sprawiają, że jest bardziej miękki).

Zobacz menu Edycja i Efekty wavepada. Każdy efekt jest w pełni wyjaśniony na stronie Efekty.