Giọng chuẩn không có 1 công thức cố định, còn tùy vào "gu" người nghe và đánh giá. Mỗi người sẽ thích một cái chuẩn khác nhau.
Tuy nhiên, có 1 cách khách quan tạm dùng để đánh giá xem giọng tiếng Việt vùng nào/tỉnh nào xứng đáng là đại diện cho giọng VN:
- Thu âm giọng đặc trưng của 63 tỉnh của VN thành 63 file mp3.
- Mỗi file ghi âm này sẽ được đưa cho dân 62 tỉnh còn lại nghe, cần test ở các tốc độ khác nhau từ 1x tới 2x và 3x (từ tốc độ thông thường 1x tới tua nhanh gấp 2 lần, 3 lần).
- Ví dụ: file ghi âm giọng Nghệ An sẽ được khảo sát đưa cho dân của 62 tỉnh còn lại (trừ Nghệ An) nghe. Khảo sát cho thấy có 75% số người nghe hiểu trọn vẹn nội dung ở tốc độ bình thường 1x, có 35% nghe hiểu tốc độ 2x và 5% nghe hiểu tốc độ 3x. Bình quân ở cả 3 tốc độ thì đạt 39%. Đây là điểm của Nghệ An, đại diện cho mức độ hiểu của dân VN khi nghe giọng Nghệ An.
- Tiếp tục thử với 62 file mp3 còn lại. Ví dụ kết quả cho thấy file của Hà Nội đạt điểm cao nhất là 85% , thì có thể tạm kết luận giọng Hà Nội được dân VN nghe hiểu và lĩnh hội nội dung được nhiều nhất, cho nên giọng HN được chọn làm giọng đại diện VN để phát thanh, giảng dạy cho người nước ngoài (ghi chú: giọng HN đạt điểm cao nhất chỉ là thí dụ chứ không phải kết luận) .
Như vậy, giọng tỉnh nào dễ nghe hiểu nhất, giọng đó là chuẩn. Phương pháp này khách quan và công bằng, loại bỏ yếu tố cảm tính, yêu ghét cá nhân vùng miền này nọ.