Дедупликация на данни в Windows Server 2012

Windows Server 2012 представя нова функция данни Deduplication (Дедупликация на данни). Какво е дедупликация? Дедупликация на данни като цяло това е процедура за намиране и изтриване на дублирани данни на носител за съхранение, без да се нарушава целостта на информацията. Целта на дублирането е да съхранява информация в малки блокове (32-128 Kb), да идентифицира същата (дублиращи се блокове) и да запише само по едно копие за всеки блок и да замени дублиращите блокове с връзки към едно копие.

Преди това беше необходимо да се използват продукти на трети страни за организиране на дедупликация (има както хардуерни решения за дедупликация на ниво дискови масиви, така и софтуер на ниво файл). Цената на подобни решения беше доста висока, защото те са насочени предимно към заможни корпоративни клиенти. Сега тази функция е абсолютно безплатна за всички потребители на Windows Server 2012.

Има малък хак, който ви позволява да активирате дедупликацията в клиентските операционни системи (Windows 8 и Windows 8.1). Подробности в статията: Как да активирате дедупликацията на данни в Windows 8.1

В Windows Server 2012 дедупликацията се реализира като два компонента:

  • Драйвер на филтъра, която контролира функциите за вход / изход
  • Услуги за дедупликация - контролира три операции ("Събиране на боклук", "Оптимизация" и "Почистване").

Тези компоненти са отговорни за намирането на съвпадение на данните, организирането на тяхното съхранение в единствено число и правилното осигуряване на достъп до тях.

Преди това дедупликацията в продуктите на Microsoft беше открита в пощенския сървър на Exchange 200/2003/2007 - в компонента за единично съхранение (само едно копие на съобщението се съхранява на сървъра в пощенската кутия на един от получателите, а останалите получатели получават само връзка към него).

Дедупликацията на данни в Windows Server 2012 работи на заден план и се стартира по подразбиране на всеки час. Процесът започва, когато натоварването на сървъра е ниско и не намалява общата производителност на сървъра. Също така по подразбиране файловете, които не са достъпни повече от 30 дни, се дедуплицират. В допълнение, процедурата не се изпълнява за следните типове файлове: AAC, ФАИ, AIFF, Паниката, ASX, о, АВИ, FLAC, jpeg, m3ф, среден, MIDI, Mov, MP1, mp2, mp3, mp4, MPa, МДГ, MPEG, MPEG2, mpeg3, MPG, OGG, QT, qtw, овен, RM, RMI, RMVB, Snd, SWF, VOB, WAV, восък, WMA, WMV, wvx, ACCDB, accde, accdr, accdt, docm, DOCX, dotm, dotx, pptm, potm, potx, ppam, PPSX, PPTX, sldx, sldm, thmx, XLSX, xlsm, xltx, xltm, xlsb, xlam, xll, ас, дъга, ARJ, BHX, b2, такси, GZ, софтуерна, НРК, hqx, буркан, LHA, LZH, LZX, Pak, яма, RAR, море, седнете, sqz, TGZ, UU, uue, Z, цип, зоопарк.

Функционалността за управление на дедупликацията е достъпна от GUI и през PowerShell. Обмислете и двата варианта.

Графичен интерфейс за дедупликация на данни на Windows Server 2012

За да активирате дедупликацията на данни, трябва да инсталирате компонента данни Deduplicaion ролите Услуги за файлове и съхранение. Можете да направите това от конзолата Сървър Manahger.

След като инсталирате компонента, отворете мениджъра на сървъра -> Файлове и услуги за съхранение -> Томове -> конзола и щракнете с десния бутон върху секцията, за която искате да активирате дедупликацията, и изберете Конфигурирайте дедупликация на данни.

В следващия прозорец, поставете отметка в „Активиране на дедупликацията на данни“. Тук можете да укажете директории, които не е необходимо да се дедуплицират, и настройки на планировника на дедупликациите.

Текущото ниво на дедупликация ще бъде показано в колоната. Deduplication скорост (актуализира се след няколко часа).

За да се анализира използването на дисково пространство и възможните спестявания от активиране на дедупликацията за този обем, е разработена помощна програма DDPEVAL.Търсейки. Можете да прецените колко дисково пространство можете да спестите след включване на дедупликацията на данни, като използвате следната команда (обърнете внимание, че за големи обеми може да създаде значително натоварване на процесора)

c: \ windows \ system32 \ ddpeval.exe e: \

В моя случай спестяванията биха били около 57%.

Дедупликация на Powershell

Процесът на дедупликация може да се контролира и от Powershell. За да направите това, инсталирайте функцията Data-Deduplication с помощта на командите:

Импорт-модул ServerManager
FS-Data-дедупликация на добавяне на WindowsFeature-име
Дедупликация на импорт-модул

След като функцията за дедупликация е активирана, тя трябва да бъде конфигурирана. За да активирате дедупликацията за D: устройството, изпълнете командата:

Enable-DedupVolume D:

По подразбиране файловете, които не могат да бъдат достъпни (Последен достъп) за повече от 30 дни, се дублират. Тази стойност може да бъде променена, например, за 2 дни, за да направите това, изпълнете командата:

Set-DedupVolume D: -MinimumFileAgeDays 2

Обикновено процесът на дедупликация се стартира от програмиста на Windows, но може да се стартира и ръчно:

Start-DedupJob D: Оптимизация на типа

Текущата статистика може да се гледа с помощта на командата:

Get-DedupStatus

Списък на текущите задачи можете да намерите чрез командата:

Get-DedupJob

Всички резултати за силата на звука могат да бъдат показани с командата PoSH:

Get-DedupMetadata -Volume D:

И накрая, можете напълно да отмените дедупликацията за обем с командата:

Start-DedupJob -Volume D: -Type Unoptimization

На екрана по-долу се вижда, че след активиране на дедупликацията на E: устройството (за теста сложих 4 от същия ISO на него с Windows 8), размерът на използваното дисково пространство намаля от 12 GB на 3 GB.

Услугата за дедупликация съхранява своята база данни и дедуплицирани парчета в директорията System Volume Information. Следователно, в никакъв случай не трябва ръчно да се намесвате в неговата структура.

Най-добри практики за използване на дедупликация на данни в Windows Server 2012

Microsoft публикува следните резултати от проучване за ефективността на дублирането на различни типове данни.

Типове данниВъзможни спестявания на място
Общи данни50-60%
документи30-50%
Библиотека с приложения70-80%
VHD библиотека (X)80-95%

Основни характеристики на дедупликацията на данни в Windows Server 2012:

  • Работи само на NTFS обеми и не поддържа файловата система ReFS.
  • Не се поддържа за зареждане и системни обеми
  • Не работи със компресирани и криптирани NTFS файлове
  • Поддържа кеширане и BITS
  • Не поддържа файлове по-малко от 32KB
  • Не се конфигурира чрез групови правила
  • Не поддържа съвместни томове с клъстер
  • Дедупликация - процесът не е мигновен и отнема известно време