Please use this identifier to cite or link to this item: https://dspace.univ-ouargla.dz/jspui/handle/123456789/31503
Title: Une Approche de Tatouage Numérique Irréversible pour la Protection des Fichiers Audio
Authors: KHALDI, Amine
KAFI, Mohammed. R
EUSCHI, Salah
Keywords: Tatouage audio numérique
tatouage aveugle
bit le moins significatif
transformée de Fourier discrète
transformée en Cosinus discrète
transformée en ondelettes discrètes
domaine spatial
domaine de transformées
Digital audio watermarking
blind watermarking
least significant bit
discrete Fourier transform
discrete cosine transform
discrete wavelet transform
spatial domain
transform domain
العلامات الوسمية الصوتية الرقمية
العلامات الوسمية العمياء
البيت الأقل أهمية
تحويل فورييه المنفصل
تحويل جيب التمام المنفصل
التحويل المويجي المنفصل
المجال المكاني
مجال التحويل
Issue Date: 2022
Abstract: L’objectif principal de cette thèse est la conception et l’implémentation d’approches de tatouage audio numérique aveugles. Ces approches doivent être efficaces, robustes et imperceptibles et sont destinées à protéger des fichiers audio, échangés en télémédecine. Ce tatouage est réalisé par la dissimulation d’informations secrètes dans le fichier audio hôte et la marque insérée par un tel schéma de tatouage ne doit pas être effaçable, sans avoir recours à la clé ou à la méthode d’insertion. La marque est composée des informations du patient et des données d'acquisition. Ainsi, lors du processus d'extraction, une comparaison entre les informations du patient et la marque indiquera si les données ont été modifiées ou non. Cela permettra de s'assurer que l'échantillon correspond bien au patient indiqué dans l'enregistrement. Trois contributions originales ont été proposées dans cette thèse. Dans notre première contribution intitulée " Un algorithme de tatouage audio basé sur la transformée de Fourier pour la protection des sons respiratoires "; nous avons proposé deux nouveaux schémas de substitution pour le tatouage audio numérique basé sur la transformée de Fourier. L'insertion de la marque a été réalisée en combinant la parité des valeurs des coefficients successifs, chaque variante représente une combinaison différente. Dans nos expériences, plusieurs variantes de la transformée de Fourier sont utilisées à savoir une Transformée de Fourier Discrète, une Transformée de Fourier Fractionnelle ainsi qu'une Transformée de Fourier Discrète Quaternion. Pour chaque transformée, les deux variantes de notre schéma de tatouage sont appliquées et les résultats obtenus ont montré que notre approche offre une bonne imperceptibilité et génère un échantillon audio tatoué robuste contre diverses attaques avec une marque de haute qualité. Cependant, l'utilisation de petits fichiers audio pour nos expériences réduit considérablement la capacité de notre approche dans le domaine fréquentiel. Dans notre deuxième contribution intitulée " Approches spatiales et fréquentielles pour la protection des fichiers audio " ; nous avons proposé un nouveau schéma d'insertion pour le tatouage aveugle des fichiers audio. L'objectif est de trouver un compromis entre la capacité et l'imperceptibilité afin de cacher autant de données que possible tout en minimisant la dégradation du fichier. Ce schéma d'insertion est mis en œuvre dans les trois domaines d'insertion : spatial, fréquentiel et multi-résolution. Pour l'insertion dans le domaine spatial, la marque est insérée directement dans les échantillons de données. Pour l'insertion dans le domaine fréquentiel, une transformée en cosinus discrète est appliquée aux trames audio, après l'étape de seuillage et de quantification, la marque est insérée dans les coefficients de la transformée en cosinus discrète pour obtenir le fichier tatoué. Pour l'insertion dans le domaine multi-résolution, une transformée en ondelettes discrètes à un seul niveau est appliquée en utilisant le filtre passe-bas de mise à l'échelle et le filtre passe-haut d'ondelettes. L'insertion de la marque est ensuite effectuée à l'aide des coefficients AC obtenus. Le processus de dissimulation proposé combine trois valeurs pour insérer deux bits et une seule valeur peut être modifiée, ce qui réduit la probabilité de modification contrairement aux autres approches. Cela implique moins de modification et donc moins de distorsion du fichier hôte, ce qui explique le bon rapport signal/bruit obtenu de plus de 59dB pour l'insertion dans le domaine spatial et donc une imperceptibilité raisonnable. Une évaluation de la robustesse du tatouage démontre que les schémas proposés génèrent des échantillons tatoués raisonnablement robustes contre diverses attaques et une marque insérée de haute qualité avec une corrélation croisée normalisée supérieure à 0,9 pour les trois domaines d’insertion. Dans notre troisième contribution intitulée " Un schéma de tatouage audio basé sur la combinaison de valeur de parité pour la protection des sons de battements de cœur " et afin de protéger les données échangées en télémédecine ; nous avons proposé un schéma de tatouage aveugle pour la protection des sons du rythme cardiaque. Deux schémas innovants de tatouage aveugle ont été proposés, chaque schéma élaboré a été décliné en deux variantes spécifiques. L'insertion réussie de la marque se fait typiquement en combinant trois valeurs successives de parité, chaque variante représente une combinaison différente. Ces approches ont été mises en œuvre dans les trois domaines d'insertion : spatial, fréquentiel et multi-résolution. Pour le domaine spatial, la marque est insérée dans les valeurs d'échantillons du fichier. Dans le domaine fréquentiel, les bits de la marque sont substitués au bit le moins significatif du coefficient DCT. Pour l'insertion dans le domaine multi-résolution, après avoir calculé une DWT à un seul niveau, les coefficients de sous-bande AC obtenus sont utilisés pour le processus d'insertion. Après avoir comparé les approches que nous avons utilisées aux divers travaux récents dans les trois domaines utilisés, les résultats obtenus démontrent suffisamment que notre deuxième approche proposée offre une bonne imperceptibilité pour l'insertion observée dans les domaines fréquentiel et spatial. Cependant, l'utilisation de petits fichiers audio pour nos expériences réussies réduit considérablement la capacité de nos méthodes utilisées dans le domaine fréquentiel.
The main objective of this thesis is the design and implementation of blind digital audio watermarking approaches. These approaches must be efficient, robust and imperceptible and are intended to protect audio files, exchanged in telemedicine. This watermarking is achieved by hiding secret information in the host audio file and the mark inserted by such a watermarking scheme must not be erasable, without the use of the key or insertion method. The mark is composed of the patient information and the acquisition data. Thus, during the extraction process, a comparison between the patient information and the mark will indicate whether or not the data has been altered. This will ensure that the sample matches the patient indicated in the record. Three original contributions were proposed in this thesis. In our first contribution entitled "A Fourier transform-based audio watermarking algorithm for respiratory sound protection"; we propose two new substitution schemes for digital audio watermarking based on the Fourier transform. The integration of the watermark will be performed by combining the parity of the successive coefficients values; each variant will represent a different combination. In our experiments several variants of the Fourier transform are used (Discrete Fourier Transform, a Fractional Fourier Transform as well as a Quaternion Discrete Fourier Transform). For each transform, both variants of our watermarking scheme are applied and the results obtained show that our approach offers good imperceptibility and generates watermarked audio sample robust against various attacks with a high quality watermark. However, using small audio file for our experiments considerably reduces the capacity of our approach in the frequency domain. In our second contribution entitled "Spatial and frequency approaches for audio file protection" and in order to protect audio files, we propose a new integration scheme for blind audio file watermarking. The goal is to find a compromise between capacity and imperceptibility in order to hide as much data as possible while minimizing file degradation. This integration scheme is implemented in the three insertion domains: spatial, frequency and multi-resolution domain. For the spatial domain integration, the mark is inserted directly into the data samples. For the frequency domain integration, a Discrete Cosine Transform is applied to the audio frames, after the thresholding and quantification step the watermark is inserted into the Discrete Cosine Transform coefficients to obtain the watermarked file. For the multi-resolution domain insertion, a single level Discrete Wavelet Transform is applied using the scaling low pass filter and wavelet high pass filter. The watermark integration is then performed using the obtained AC coefficients. The proposed concealment process combines three values to integrate two bits and only one may be modified, which reduces the probability of change unlike other approaches. This implies less modification and therefore less distortion of the host file, this explains the good Signal to Noise Ratio obtained more than 59dB for the spatial domain integration and therefore a reasonable imperceptibility. An evaluation of the watermark's robustness demonstrates that the proposed schemas generate reasonably robust watermarked samples against various attacks with a high-quality watermark with a normalized cross correlation greater than 0.9 for the three insertion domain. In our third contribution entitled "A parity value combination based audio watermarking scheme for heartbeat sound protection" and in order to enhance the security of data exchanged in telemedicine, we propose a blind watermarking scheme for heartbeat sounds protection. Two innovative schemes of blind watermarks are proposed; each elaborate scheme will be declined into two specific variants. The successful watermark integration will be typically done by combining three successive values parity; each variant will adequately represent a different combination. These approaches will be implemented in the three insertion domains: spatial, frequency and multi-resolution domain. For the spatial domain, the watermark will be integrated into the samples values of the file. In the frequency domain, the watermark bits will be substituted to the DCT coefficient’s least significant bit. For the multi-resolution domain insertion, after calculating a DWT, the obtained AC sub-band coefficients will be used for the integration process. After comparing our used approaches to the various recent works in the three used domains; the obtained results sufficiently demonstrate that our second proposed approach offers a good imperceptibility for the observed frequency and spatial domains insertion. However, using small audio file for our successful experiments significantly reduces the capacity of our used methods in the frequency domain.
الهدف الرئيسي من هذه الأطروحة هو تصميم وتنفيذ مناهج العلامات الوسمية الصوتية الرقمية العمياء. يجب أن تكون هذه الأساليب فعالة وقوية وغير محسوسة وتهدف إلى حماية الملفات الصوتية التي يتم تبادلها في التطبيب عن بعد. يتم تحقيق هذه العلامة المائية عن طريق إخفاء المعلومات السرية في ملف الصوت المضيف ويجب ألا تكون العلامة التي تم إدخالها بواسطة مخطط العلامات المائية هذه قابلة للمسح دون استخدام المفتاح أو طريقة الإدراج. تتكون العلامة من معلومات المريض وبيانات الاستحواذ. وبالتالي ، أثناء عملية الاستخراج ، ستشير المقارنة بين معلومات المريض والعلامة إلى ما إذا كان قد تم تغيير البيانات أم لا. سيضمن ذلك تطابق العينة مع المريض المشار إليه في السجل. تم اقتراح ثلاث مساهمات أصلية في هذه الأطروحة. في مساهمتنا الأولى بعنوان "خوارزمية للعلامات الوسمية الصوتية القائمة على التحويل من فورييه لحماية اصوات الجهاز التنفسي" ؛ نقترح مخططين جديدين لاستبدال العلامة الوسمية الصوتية الرقمية بناءً على تحويل فورييه. سيتم تنفيذ إدراج العلامة الوسمية من خلال الجمع بين تكافؤ قيم المعاملات المتتالية ؛ كل متغير سيمثل مجموعة مختلفة. في تجاربنا ، تم استخدام العديد من المتغيرات لتحويل فورييه (تحويل فورييه المنفصل ، تحويل فورييه الجزئي بالإضافة إلى تحويل فورييه المتقطع الرباعي). لكل تحويل ، يتم تطبيق كلا المتغيرين من مخطط العلامات الوسمية لدينا وتظهر النتائج التي تم الحصول عليها أن نهجنا يوفر عدم إدراك جيد ويولد عينة صوتية تحمل علامة وسمية قوية ضد الهجمات المختلفة بعلامة وسمية عالية الجودة. ومع ذلك ، فإن استخدام ملف صوتي صغير لتجاربنا يقلل بشكل كبير من قدرة نهجنا في مجال التردد. في مساهمتنا الثانية بعنوان "المقاربات المكانية والترددية لحماية الملفات الصوتية" ومن أجل حماية الملفات الصوتية ، نقترح مخطط تكامل جديد للعلامة الوسمية لملفات الصوت العمياء. الهدف هو إيجاد حل وسط بين السعة وعدم الإدراك من أجل إخفاء أكبر قدر ممكن من البيانات مع تقليل تدهور الملف. يتم تنفيذ مخطط التكامل في مجالات الإدراج الثلاثة: المجال المكاني والتردد ومجال الاستبانة المتعددة. للتكامل في المجال المكاني ، يتم إدراج العلامة مباشرة في عينات البيانات. للإدراج في مجال التردد ، يتم تطبيق تحويل جيب التمام المنفصل على الإطارات الصوتية ، بعد خطوة العتبة والتقدير الكمي ، يتم إدخال العلامة الوسمية في معاملات تحويل جيب التمام المنفصل للحصول على الملف ذي العلامة الوسمية. للإدراج في المجال متعدد الدقة ، يتم تطبيق تحويل الموجة المنفصلة على مستوى واحد باستخدام مرشح التمرير المنخفض التحجيم ومرشح التمرير العالي المويج. ثم يتم تنفيذ ادراح العلامة الوسمية باستخدام معاملات التيار المتردد التي تم الحصول عليها. تجمع عملية الإخفاء المقترحة بين ثلاث قيم لدمج بتتين ويمكن تعديل قيمة واحدة فقط ، مما يقلل من احتمالية التغيير على عكس الأساليب الأخرى. هذا يعني تعديلًا أقل وبالتالي تشويهًا أقل لملف المضيف ، وهذا يفسر نسبة الإشارة إلى الضوضاء الجيدة التي تم الحصول عليها أكثر من 59 ديسيبل لتكامل المجال المكاني وبالتالي عدم الإدراك المعقول. يوضح تقييم متانة العلامة الوسمية أن المخططات المقترحة تولد عينات قوية بشكل معقول من العلامات الوسمية ضد الهجمات المختلفة بعلامة وسمية عالية الجودة مع ارتباط متقاطع طبيعي أكبر من 0.9 لمجالات الإدراج الثلاثة. في مساهمتنا الثالثة بعنوان "مخطط العلامات الوسمية الصوتية على أساس مزيج قيم التكافؤ لحماية صوت ضربات القلب" ومن أجل تعزيز أمن البيانات المتبادلة في التطبيب عن بعد ، نقترح مخطط علامة وسمية عمياء لحماية أصوات ضربات القلب. تم اقتراح خطتين مبتكرتين للعلامات الوسمية العمياء ؛ سيتم وضع كل مخطط تفصيلي إلى متغيرين محددين. عادةً ما يتم تكامل العلامة الوسمية الناجح من خلال الجمع بين ثلاث قيم متتالية التكافؤ ؛ كل متغير سيمثل بشكل مناسب مجموعة مختلفة. سيتم تنفيذ هذه الأساليب في مجالات الإدراج الثلاثة: المجال المكاني والتردد ومجال الاستبانة المتعددة. بالنسبة للمجال المكاني ، سيتم دمج العلامة الوسمية في عينات قيم الملف. في مجال التردد ، سيتم استبدال بتات العلامة الوسمية بالبت الأقل أهمية لمعامل DCT. بالنسبة لإدراج المجال متعدد الاستبانة ، بعد حساب DWT ، سيتم استخدام معاملات النطاق الفرعي AC التي تم الحصول عليها لعملية التكامل. بعد مقارنة مناهجنا المستخدمة مع الأعمال الحديثة المختلفة في المجالات الثلاثة المستخدمة ؛ توضح النتائج التي تم الحصول عليها بشكل كافٍ أن نهجنا الثاني المقترح يوفر عدم إدراك جيد للتردد المرصود والمجالات المكانية. ومع ذلك ، فإن استخدام ملف صوتي صغير لتجاربنا الناجحة يقلل بشكل كبير من قدرة الأساليب المستخدمة لدينا في مجال التردد.
Description: Réseaux et Systèmes d’Information Multimédia
URI: https://dspace.univ-ouargla.dz/jspui/handle/123456789/31503
Appears in Collections:Département d'informatique et technologie de l'information - Doctorat

Files in This Item:
File Description SizeFormat 
euschi_finale_Doctorat.pdf1,98 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.