1) Символы. Объем информации для хранения одного символа зависит от кодировки. В старой классической популярной и фундаментальной кодировке ASCII каждый символ в памяти компьютера хранится в 1-м байте (в 8 битах) - т.е. в наборе именно этих единиц и нулей.
Если перебрать все наборы единиц и нулей размером 1 байт (8 бит), то получится всего 256 комбинаций - именно столько символов и позволяет хранить эта базовая кодировка компьютера:
0. 00000000
1. 00000001
2. 00000010
3. 00000011
4. 00000100
5. 00000101
...
252. 11111100
253. 11111101
254. 11111110
255. 11111111
Сейчас же скорее всего в твоем браузере выбрана кодировка UTF-16 и каждый символ веб-страницы закодирован 2 байтами (16 битами), т.е. всего 65536 комбинаций нулей и единиц:
0. 00000000 00000000
1. 00000000 00000001
...
65534. 11111111 11111110
65535. 11111111 11111111
Если же у тебя кодировка UTF-32, то каждый символ закодирован 4 байтами (32 бит), а это 4294967296 комбинаций из нулей и единиц:
0. 00000000 00000000 00000000 00000000
1. 00000000 00000000 00000000 00000001
...
4294967294. 11111111 11111111 11111111 11111110
4294967295. 11111111 11111111 11111111 11111111
2) Звуки хранятся в файлах. Файлы состоят из тех же самых байтов, которые состоят из битов (из тех же самых наборов нулей и единиц). Звук состоит из колебаний. Амплитуда этих колебаний и кодируется (хранится в нулях и единицах).
Как каждый символ имеет свою кодировку, так же и каждый звуковой файл имеет свой формат.
Здесь описание распространенного эталонного базового несжатого формата звука wav (т.е. как именно хранится звук в файле этого типа)
Любую информацию, включая символы, звуки, изображения, можно оцифровать. Например, разбиваем изображения на точки и для каждой указываем ее координаты, а так же сколько в ней синего цвета, зелёного и красного. Вот и получается цифровое описание картинки. Захотим посмотреть- специальный алгоритм построит нам все эти точки и мы увидим картину