ذخیره سازی سند

تدوين:شهنازپیروزفر

ذخیره سازی سند بعضی از عناصر را با ذخیره سازی داده‌ها به اشتراك می‌گذارد ، لذا ما در ابتدا دو تعریف ذخیره سازی را مرور می‌كنیم . چهار ویژگی ذخیره سازی عبارتند از :

   موضوع-گرا

   یكپارچه

   تغیر- زمانی

   پایدار

 

موضوع‌گرا بدین معناست كه داده‌‌ها به جای اینكه پیرامون عملیات نیازمندی‌های پردازشی سازماندهی شوند، پیرامون موضوع خاصی ساماندهی می‌شوند. انبارهای داده‌ها یكپارچه هستند، زیرا داده‌ها از چندین منبع جمع آوری می‌شوند .تغیر- زمانی بدین معناست كه داده‌های موجود در انبار داده‌ها در دوره زمانی خاصی شناسایی می‌شوند و سرانجام اینكه ویژگی پایداری یعنی داده‌ها به محض اینكه به انبارداده‌ها افزوده شدند،‌حذف نمی‌شوند.

خصوصیات ذخیره سازی سندعبارتند از :

یك نوع یا یك ساختار سند وجودندارد.

اسناد برگرفته ‌از چندین منبع‌ هستند.

گونه‌های اصلی اسناد به طورخودكار استخراج‌ و در انبار سند ذخیره‌ می‌‌شوند.

انبارهای ‌اسناد برای یكپارچه سازی‌اسنادی كه از نظر معنایی به هم وابسته‌اند، طراحی ‌می‌شوند.

 

 

شكل 1: انبارهای سند، برگرفته از چندین‌‌منبع

 

انواع سند

اغلب برنامه‌های DMS با یك نوع سند نظیر فرم‌های شكایت بیمه سروكار دارند. هر نوع سندی می‌تواند در انبارسند مورد استفاده قرارگیرد. با این‌ وجود،نحوه پردازش اسناد با توجه به نوعشان، متفاوت است. برای‌مثال، پست الكترونیك نسبتا كوتاه است، لذا نیازی‌به استفاده ‌از تكنیك‌های‌ اتومات ‌خلاصه سازی نیست. هنگامی كه ‌اسناد از منابع ‌داخلی‌‌ جمع آوری می‌شوند، عموما زبانی را كه برای نوشتن سند استفاده ‌شده ‌است، می‌شناسیم. با این ‌وجود، متون ‌جمع‌آوری ‌شده ‌از وب‌ می‌توانند به هر زبانی ‌باشند. به همین ‌دلیل، اولین گام، شناسایی زبان سند است، یا از طریق ‌متا داده‌های موجود در صفحه ‌وب یا با به كارگیری ‌برنامه ‌شناسایی‌زبان.

 

منابع چندگانه

خصوصیت دوم انبارهای سند این ‌است ‌كه اسناد از چند منبع ‌به ‌دست ‌می‌آیند. سازمان‌ها، كامپیوترهای ‌شخصی، سرور و  SAN (Storage Area Network دارند كه با سند بارگذاری ‌می‌شوند و حاوی اطلاعات ‌كلیدی ‌كسب و كار هستند. ما می‌توانیم با كمك انبار سند، اسناد را به‌ گونه‌ای ساخت‌یافته ‌در آوریم تا از تجزیه ‌و تحلیل ‌و بازیابی ‌محتوای ‌‌معنایی سند پشتیبانی ‌كند، نه صفات خارجی ‌نظیر مكان ‌و نام ‌فایل. لذا هنگامی ‌كه فردی ‌بخواهد با محتویات ‌سند كار كند، محدودیت ‌فضای ‌ذخیره‌سازی ‌‌مبتنی بر فایل ‌سیستم به خوبی ‌مشخص ‌می‌‌شود. برای مثال وكلایی ‌كه ‌برای ‌پیگیری ‌پرونده‌ها با حجم ‌عظیمی ‌از متون ‌سر و كار دارند از پایگاه ‌‌متنی ‌استفاده می‌كنند. این‌ پایگاه‌ برای ذخیره‌سازی و شاخص‌ گذاری ‌متن ‌به ‌كار می‌رود. و در حالیكه نیازهای ‌بسیاری ‌از كاربران ‌را برآورده می‌سازد اما استخراج اطلاعات ‌را انجام ‌نمی‌دهد ‌‌یا آنرا از نظر معنایی‌ به ‌سایر اسناد مرتبط‌ ‌نمی‌سازد. پایگاه‌های ‌متنی‌ و سيستم‌هاي‌ مديريت سند بر خلاف انبارداده‌ها كه برای تصمیم‌گیری به كار می‌روند، عملیات ‌تراكنش‌- گرا نظیر یافتن ‌اسنادی‌ را كه حاوی‌ عبارت ‌خاصی ‌هستند، انجام می‌دهند. پس دلیل ‌استفاده از ‌چند منبع ‌این ‌است كه یك منبع به تنهایی‌حاوی همه اطلاعات مورد نیاز ما نیست.

 

استخراج محتوای‌معنایی

استخراج محتوای ‌سند فرایند مهمی در ذخیره‌سازی ‌سند محسوب ‌می‌شود. این‌ كار به روش‌های ‌مختلف انجام‌ می‌‌شود كه عبارتند از:

شناسایی‌ موضوعات‌ مهم

استخراج‌ گونه‌های ‌كلیدی

خلاصه‌سازی ‌محتوا

گاهی ‌اوقات‌ شناسایی ‌موضوعات مهم، رده‌بندی ‌نامیده ‌می‌شود. این ‌روش برای شاخص‌گذاری موضوعی سودمند است و به ما امكان ‌می‌دهد تا در خواست خود را به كمك موضوعات بیابیم نه فقط‌ با كلید واژه‌ها. گونه‌های ‌كلیدی ‌سند ‌عبارتند از: نام ‌اشخاص، اماكن، سازمان‌ها و ارتباط بین ‌‌آنها. گونه‌های‌ كلیدی نیز ‌همانند شاخص‌گذاری‌ موضوعی ‌شناسایی ‌می‌كند كه سند ‌درباره ‌چیست، اما می‌تواند ‌جزییات ‌بیشتری ‌را در این‌ باره استخراج ‌نماید. اغلب، نیازی ‌نیست كه‌ همه ‌متن ‌خوانده ‌شود‌، بلكه ‌خواندن ‌چكیده‌ آن ‌‌كافیست. در حال حاضر، ابزارهای ‌بسیاری ‌برای ‌خلاصه ‌‌‌سازی ‌محتوا وجود دارند. در واقع، این ‌ابزارها واژه‌های ‌مشترك ‌در متن ‌را می‌یابند.

سپس جملات با توجه ‌به تعداد واژگانی ‌كه‌ دارند، وزن ‌دهی ‌می‌شوند. در واقع، خلاصه‌سازی ‌روش موثری ‌برای ‌كاهش ‌دادن ‌كاربران ‌نهایی ‌انبار سند است.

 

مزایای ذخیره‌سازی‌سند

مهمترین‌ مزیت ‌ذخیره‌سازی ‌سند این ‌است ‌كه حوزه ‌رسیدن به‌ هوشمندی تجاری ‌را بسط‌ می‌دهد. در جایی‌كه هدفمان ‌بهبود عملیات ‌كسب‌ و كار، فروش، بازاریابی‌ یا تحقیق ‌و توسعه است، بهره‌گیری ‌از اطلاعات ‌متنی در مقایسه‌ با كسانی ‌كه فقط ‌از عدد و شماره ‌استفاده می‌كنند، مزیت‌ رقابتی ‌به ‌شمار می‌رود. بعضی ‌از مزایای ‌عمده ذخیره‌سازی سند ‌عبارتند از:

هوشمندی ‌تجاری ‌غنی‌تر

شناخت ‌مشتریان

نظارت ‌فرا محیط

سنجش‌ تكنولوژی

 

هوشمندی ‌تجاری ‌غنی‌تر

ذخیره‌سازی‌ سند امكان می‌دهد تا فراتر از سنجش‌های‌ عددی ‌كارآیی، ‌حركت كنیم. البته ‌این ‌سنجش‌ها نیز ضروریند و اولین ‌راه ‌برای ‌ردیابی ‌عملیات ‌محسوب ‌می‌شوند. اما تصویر كاملی از اشتباهاتی‌ كه‌ روی ‌می‌دهند، نشان ‌نمی‌دهند. كاهش‌ تولید ‌یا افزایش ‌مشكلات ‌كنترل ‌كیفیت ‌را می‌توان‌ به سرعت با گزارشگیری‌ یا ابزارهای ‌مربوطه ‌رفع‌ نمود، اما دلیل روی دادنشان را نمی‌دانیم. شاید تولید به ‌دلیل تاخیر در عرضه‌ اجزای ضروری ‌افت ‌كرده ‌باشد. آیا ممكن است مشكلات ‌مربوط به فروشنده نیز نقش داشته باشند؟ آیا می‌توان ‌افت تولید را پیش بینی‌ كرد و مثلا با ردیابی وضعیت ‌مالی فروشنده از آن ‌پیشگیری ‌نمود؟ شاید، اما بدون ‌بهره‌گیری ‌از ابزارهای ‌اتومات‌، ردیابی ‌اطلاعات ‌متنی ‌‌كارآیی ‌چندانی ‌ندارد. اتومات ‌سازی ‌جمع‌آوری ‌اطلاعات ‌سبب می‌شود تا فقط‌ حقایق ‌و گونه‌های ‌اصلی ‌شناسایی ‌شوند و سیاستگذاران ‌با در اختیار داشتن ‌این ‌اطلاعات می‌توانند حوزه هوشمندی‌ تجاری ‌را در زمینه ‌عملیات ‌‌كلیدی ‌بسط دهند.

 

شناخت مشتریان

بازاریابی ‌شخصی ‌در برخی ‌از صنایع مشتری‌مدار، جایگزین ‌بازاریابی ‌انبوه ‌شده ‌است. زیرا فروشندگان ‌می‌توانند جزییات الگوهای‌ خرید‌ و علائق ‌شخصی را ردیابی كنند و بدین ‌ترتیب بازاریاب‌ها می‌توانند مشتریان ‌را هدف ‌قرار دهند. فعالیت در دنیای ‌كسب و كار-كسب و كار، داستان ‌متفاوتی ‌اما با همان ‌قوانین ‌دارد. اگر درباره ‌مشتریان‌ تجاری ‌خود اطلاعات ‌كافی ‌داشته باشید، بهتر می‌توانید آنان ‌را هدف ‌قرار دهید. آیا تغییر محیط‌ برای مشتریان ‌شما ‌فرصت ‌ایجاد می‌كند ‌یا تهدید محسوب‌ می‌شود؟ چگونه ‌جهانی ‌شدنی ‌بر آنان ‌تاثیر می‌گذارد؟ آیا تاثیر پذیریشان‌ یكسان ‌است‌ یا متفاوت؟ آیا خط‌ تولید یا خدمت شما می‌تواند با توجه به تغییر بازار با مشتریان شما سازگار شود؟ پاسخ‌ به‌ این ‌پرسش‌ها نیاز به ‌زمان ‌و تجزیه و تحلیل دارد. انبار سند سبب كارآمدتر شدن‌ این‌ فرایند ‌می‌شود.

 

مدیریت استراتژیك و فرامحیط

مدیریت ‌استراتژیك ‌هنر و علم ‌هدایت ‌‌شركت‌ها ‌در رویارویی با پیشامدهای ‌داخل ‌و خارج ‌از سازمان ‌است. مدیران استراتژیك باید ‌بتوانند ‌پرسش‌های ‌زیر را پاسخ‌ دهند. آیا شركت یك تولید كننده ‌ارزان است‌ یا گران؟ چگونه ‌شركت می‌تواند ‌خط تولید خود را متمایز سازد؟ آیا باید بر بخشی ‌از بازار متمركز شود یا كل آن؟ تصمیم‌گیری‌ بدون ‌توجه ‌به این‌ كه ‌سایرین ‌چه ‌كار می‌كنند، نتایج دور از انتظاری ‌را بوجود ‌می‌آورد.

 

سنجش تكنولوژی

تغییرات سریع در تكنولوژی برای برخی محصولات مانع ‌و برای ‌برخی ‌دیگر فرصت ‌محسوب ‌می‌شود. شركت‌ها ‌با درك‌ جایگاه ‌تكنولوژی‌اشان‌ در صنعت ‌می‌توانند از چالش‌های ‌دور از انتظار پیشگیری ‌كنند. و این ‌امر مستلزم ‌آگاهی ‌از تكنولوژی ‌رقباست.

 

 

 

بازگشت

Copyright 2004, PC World Iran. All rights reserved.